<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000200005</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Algoritmo OneR. Su aplicación en ensayos clínicos]]></article-title>
<article-title xml:lang="en"><![CDATA[OneR Algorithm. Its application on Clinical Trials]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Cardoso García]]></surname>
<given-names><![CDATA[Yanet]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Arza Valdés]]></surname>
<given-names><![CDATA[Luis]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas Centro de Tecnologías de Gestión de Datos ]]></institution>
<addr-line><![CDATA[ La Habana]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Empresa Comercializadora y de Servicios a la Salud  ]]></institution>
<addr-line><![CDATA[ La Habana]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>06</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>06</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>2</numero>
<fpage>61</fpage>
<lpage>72</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000200005&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN Los Ensayos Clínicos constituyen una etapa determinante en el desarrollo de cualquier producto médico. El gran cúmulo de datos que generan y la información oculta en estos continúan siendo una importante disyuntiva para la comunidad científica. La minería de datos se convierte en una de las soluciones para el problema en cuestión. En el presente trabajo se aplica un algoritmo de reglas de inducción, el OneR, con el objetivo de mostrar patrones desde los datos contenidos en el mercado de datos del producto LeukoCIM, en fase de Ensayo Clínico por parte de los especialistas del Centro de Inmunología Molecular. La aplicación del algoritmo se llevó a cabo a través del proceso de minería de datos, guiado por la metodología CRISP-DM e integrado en el Sistema Gestor de Bases de Datos PostgreSQL. Finalmente se obtuvo un conjunto de reglas de clasificación asociadas al grado del evento adverso que presenta la enfermedad base de los pacientes, evidenciando la viabilidad de la utilización del algoritmo OneR en esta sensible rama de la sociedad.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT Clinical Trials constitute a critical stage in the development of any medical product. The large body of data generated and the information hidden in them, remain as one of the dilemmas for the scientific community. Data mining becomes one of the solutions to the problem at hand. In this paper, a OneR algorithm for induction rules is applied, with the aim of showing patterns from the data contained in the LeukoCIM product data market, in clinical trial phase by the specialists of the Molecular Immunology Center. The application of the algorithm was carried out through the data mining process, guided by the Cross-Industry Standard Process for Data Mining methodology and integrated into the PostgreSQL Database Management System. As a result, it was obtained a set of classification rules related to the level of the adverse event presented in the base disease of patients, demonstrating the feasibility of using the OneR algorithm in this sensitive sector of the society.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[algoritmo OneR]]></kwd>
<kwd lng="es"><![CDATA[Ensayos Clínicos]]></kwd>
<kwd lng="es"><![CDATA[minería de datos]]></kwd>
<kwd lng="en"><![CDATA[Clinical Trials]]></kwd>
<kwd lng="en"><![CDATA[data mining]]></kwd>
<kwd lng="en"><![CDATA[OneR algorithm]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Algoritmo  OneR. Su aplicaci&oacute;n en ensayos cl&iacute;nicos</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><font face="Verdana, Arial, Helvetica, sans-serif">OneR  Algorithm. Its application on Clinical Trials</font></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Yanet  Cardoso Garc&iacute;a<strong><sup>1*</sup></strong>, <strong>Luis  Arza Vald&eacute;s<sup>2</sup></strong></font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Centro de Tecnolog&iacute;as de Gesti&oacute;n de Datos. Universidad de las Ciencias  Inform&aacute;ticas. Carretera a San Antonio de los Ba&ntilde;os, Km 2&frac12;,  Reparto Torrens, La Habana, Cuba. CP.: 19370. ycardosog@uci.cu </font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">    <br> <sup>2</sup></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Empresa Comercializadora y de Servicios a la Salud. Avenida 43 % 44 y  48, La Ceiba. Playa. La Habana, Cuba. luis8206@gmail.com</font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:ycardosog@uci.cu">ycardosog@uci.cu</a><a href="mailto:lisvandy@ibp.co.cu"></a><a href="mailto:ycoca@uci.cu"></a><a href="mailto:valery@electrica.cujae.edu.cu"></a><a href="mailto:rtrujillo@edistancia.uo.edu.cu"></a><a href="mailto:jova@uci.cu"></a></font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:losorio@ismm.edu.cu"></a> </font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los Ensayos  Cl&iacute;nicos constituyen una etapa determinante en el desarrollo de cualquier  producto m&eacute;dico. El gran c&uacute;mulo de datos que generan y la informaci&oacute;n oculta en  estos contin&uacute;an siendo una importante disyuntiva para la comunidad cient&iacute;fica.  La miner&iacute;a de datos se convierte en una de las soluciones para el problema en  cuesti&oacute;n. En el presente trabajo se aplica un algoritmo de reglas de inducci&oacute;n,  el OneR, con el objetivo de mostrar patrones desde los datos contenidos en el  mercado de datos del producto LeukoCIM, en fase de Ensayo Cl&iacute;nico por parte de  los especialistas del Centro de Inmunolog&iacute;a Molecular. La aplicaci&oacute;n del  algoritmo se llev&oacute; a cabo a trav&eacute;s del proceso de miner&iacute;a de datos, guiado por  la metodolog&iacute;a CRISP-DM e integrado en el Sistema Gestor de Bases de Datos  PostgreSQL. Finalmente se obtuvo un conjunto de reglas de clasificaci&oacute;n  asociadas al grado del evento adverso que presenta la enfermedad base de los  pacientes, evidenciando la viabilidad de la utilizaci&oacute;n del algoritmo OneR en  esta sensible rama de la sociedad. </font>      <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">algoritmo OneR, Ensayos Cl&iacute;nicos, miner&iacute;a de  datos</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Clinical  Trials constitute a critical stage in the development of any medical product.  The large body of data generated and the information hidden in them, remain as  one of the dilemmas for the scientific community. Data mining becomes one of  the solutions to the problem at hand. In this paper, a OneR algorithm for  induction rules is applied, with the aim of showing patterns from the data  contained in the LeukoCIM product data market, in clinical trial phase by the  specialists of the Molecular Immunology Center. The application of the  algorithm was carried out through the data mining process, guided by the Cross-Industry  Standard Process for Data Mining methodology and integrated into the PostgreSQL  Database Management System. As a result, it was obtained a set of  classification rules related to the level of the adverse event presented in the  base disease of patients, demonstrating the feasibility of using the OneR  algorithm in this sensitive sector of the society.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>Clinical Trials, data mining, OneR algorithm</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la sociedad actual, el gran volumen de datos e informaci&oacute;n almacenada es  un elemento determinante en el desarrollo del conocimiento y, por ende, en la  construcci&oacute;n del mundo moderno. La m&aacute;xima &ldquo;la  informaci&oacute;n es poder&rdquo; ha marcado un  cambio profundo en la forma en que las personas interact&uacute;an, incrementando el  debate, los conflictos y los puntos de vista hacia la evoluci&oacute;n de las  Tecnolog&iacute;as de la Informaci&oacute;n y las Comunicaciones (TIC). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para tener una idea m&aacute;s acertada de la anterior afirmaci&oacute;n, en el a&ntilde;o 2000  se generaron 800.000 petabytes(PB) de datos almacenados y se espera que esta  cifra alcance los 35 zettabytes(ZB) en el a&ntilde;o 2020.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Algunas empresas generan terabytes de datos cada  hora de cada d&iacute;a del a&ntilde;o, estando  inundadas de ellos (IBM, 2012). La necesidad de analizar este volumen de datos  y explotarlos de forma eficaz, constituye un objetivo de cualquier  organizaci&oacute;n; tal es el caso de las instituciones  cient&iacute;ficas que son beneficiadas con el uso de las tecnolog&iacute;as, siendo el  Centro de Inmunolog&iacute;a Molecular (CIM) de Cuba una de ellas. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La miner&iacute;a de datos es una herramienta  fundamental para el an&aacute;lisis y descubrimiento de conocimiento a partir de  datos, permitiendo aglutinar una variedad de metodolog&iacute;as anal&iacute;ticas,  proporcionando un marco conceptual y metodol&oacute;gico para el abordaje del an&aacute;lisis  de se&ntilde;ales en distintas disciplinas. Sin embargo, cada campo de aplicaci&oacute;n  presenta desaf&iacute;os propios que deben ser abordados particularmente desde la  racionalizaci&oacute;n de los conceptos espec&iacute;ficos del &aacute;mbito, en este caso el  biotecnol&oacute;gico.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El CIM se destaca por la utilizaci&oacute;n y desarrollo de la biolog&iacute;a  molecular con el fin de estudiar diversos tipos de c&aacute;ncer, as&iacute; como la  elaboraci&oacute;n de vacunas contra dicha enfermedad y anticuerpos monoclonales.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la aprobaci&oacute;n, prueba e introducci&oacute;n de medicamentos  en el mercado, se realizan Ensayos Cl&iacute;nicos que consisten en <em>&quot;... cualquier investigaci&oacute;n en seres  humanos dirigida a descubrir o verificar los efectos cl&iacute;nicos, farmacol&oacute;gicos u  otros efectos farmacodin&aacute;micos de un producto en  investigaci&oacute;n...&quot; </em>(Ministerio de Salud P&uacute;blica, 2009). Estos cuentan de forma general con cuatro fases, donde:</font></p>     <p> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">&ndash; La fase I incluye los  primeros estudios que se realizan en seres humanos denomin&aacute;ndose fase de estudios  de farmacolog&iacute;a humana.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&ndash; La fase II tiene como objetivo proporcionar  informaci&oacute;n preliminar sobre la eficacia del producto y establecer la relaci&oacute;n  dosis-respuesta; son estudios terap&eacute;uticos exploratorios. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">&ndash; Los ensayos cl&iacute;nicos de  fase III eval&uacute;an la eficacia y seguridad del tratamiento experimental en las  condiciones de uso habituales y con respecto a las alternativas terap&eacute;uticas  disponibles para la indicaci&oacute;n estudiada. Se trata de estudios terap&eacute;uticos de  confirmaci&oacute;n.</font></p>     <p> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">&ndash; La fase IV se realiza despu&eacute;s de  la comercializaci&oacute;n del f&aacute;rmaco para estudiar condiciones de uso distintas de  las autorizadas, como nuevas indicaciones, y la efectividad y seguridad en la  utilizaci&oacute;n cl&iacute;nica diaria (Bakke, Carn&eacute;, Garc&iacute;a, 1994).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como se aprecia, cada fase tiene objetivos bien definidos para ir valorando  la eficacia del producto. Esto en gran medida transita por pruebas que van  desde pocos sujetos hasta cientos de miles, generando un c&uacute;mulo de datos  inmenso relacionado con las caracter&iacute;sticas y evoluci&oacute;n ante la administraci&oacute;n  del f&aacute;rmaco de cada individuo; datos que deben ser analizados desde lo  espec&iacute;fico hasta lo general.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Uno de los productos de  investigaci&oacute;n del CIM es el f&aacute;rmaco LeukoCIM, el cual transit&oacute; por cuatro  Ensayos Cl&iacute;nicos, siendo sus datos almacenados en un mercado de datos, con el  objetivo de extraer conocimiento relacionado con el medicamento en cuesti&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">De acuerdo a las caracter&iacute;sticas de los datos y los dis&iacute;miles algoritmos de  miner&iacute;a que se utilizan con este fin, y a partir de las necesidades de la  instituci&oacute;n cient&iacute;fica, se decide aplicar un algoritmo descriptivo que  permitiera a trav&eacute;s de reglas de inducci&oacute;n representar hip&oacute;tesis m&aacute;s  comprensibles para los especialistas de esta entidad y extraer patrones o  modelos de los datos. Se consider&oacute; entonces, aplicar el OneR, el cu&aacute;l es uno  de los algoritmos clasificadores m&aacute;s sencillos y r&aacute;pidos; dado que simplemente  identifica el atributo que mejor explica la clase de salida (Witten, 2005).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Precisamente para lograr entender el gran c&uacute;mulo de datos que se gener&oacute;  de estos Ensayos Cl&iacute;nicos y contribuir con la toma de decisiones de los  investigadores del CIM, se determin&oacute; como objetivo fundamental de este trabajo aplicar  el algoritmo OneR como parte del complejo proceso de extracci&oacute;n de conocimiento  oculto en los datos. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la presente investigaci&oacute;n se profundiz&oacute; sobre el emergente y din&aacute;mico campo de investigaci&oacute;n denominado: Descubrimiento  de conocimiento en Bases de Datos (KDD, en ingl&eacute;s <em>Knowledge Discovery in Data Bases</em>). Este presenta una secuencia de  pasos o fases que son: preparaci&oacute;n de los datos (selecci&oacute;n y transformaci&oacute;n),  miner&iacute;a de datos, evaluaci&oacute;n, interpretaci&oacute;n y toma de decisiones. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una de las fases m&aacute;s importantes dentro de este proceso es la miner&iacute;a de  datos que integra t&eacute;cnicas de an&aacute;lisis de datos y extracci&oacute;n de modelos (Usama, 1996), adem&aacute;s se define  como el an&aacute;lisis de archivos que trabaja a nivel de conocimiento con el fin de  descubrir patrones, relaciones, reglas, asociaciones o incluso excepciones  &uacute;tiles para la toma de decisiones (Rodr&iacute;guez, 2009).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>T&eacute;cnicas de miner&iacute;a de datos</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las t&eacute;cnicas de miner&iacute;a de datos constituyen un enfoque  conceptual y habitualmente son implementadas por varios algoritmos (Molina; Garc&iacute;a, 2006). Estas  pueden clasificarse en dependencia de su utilidad en t&eacute;cnicas de predicci&oacute;n,  asociaci&oacute;n, agrupamiento (clustering) y clasificaci&oacute;n. </font></p> <ul>       <li>         <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Las t&eacute;cnicas de predicci&oacute;n</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"> permiten obtener pron&oacute;sticos de comportamientos futuros a  partir de los datos recopilados.</font></font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Las t&eacute;cnicas de reglas de asociaci&oacute;n</strong> permiten establecer las posibles relaciones o  correlaciones entre distintas acciones o sucesos aparentemente independientes,  pudiendo reconocer como la ocurrencia de un suceso o acci&oacute;n puede inducir o  generar la aparici&oacute;n de otros.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Las t&eacute;cnicas de agrupamiento</strong> concentran datos dentro de un n&uacute;mero de clases  preestablecidas o no, partiendo de criterios de distancia o similitud, de  manera que las clases sean similares entre s&iacute; y distintas con las otras clases.</font></p>   </li>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Las t&eacute;cnicas de clasificaci&oacute;n</strong> consisten en definir una serie de clases donde se  puedan agrupar los diferentes casos. Dentro de este grupo se encuentran los  &aacute;rboles de decisi&oacute;n y las reglas de inducci&oacute;n (Castillo,  2014). </font></p>   </li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>T&eacute;cnicas de clasificaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Dentro de las t&eacute;cnicas de clasificaci&oacute;n se encuentra el &aacute;rbol de decisi&oacute;n y  las reglas de inducci&oacute;n, siendo esta &uacute;ltima la utilizada durante la  investigaci&oacute;n, la cual permite la generaci&oacute;n de reglas a partir de los datos de  entrada. La informaci&oacute;n de entrada ser&aacute; un conjunto de casos donde se ha asociado  una clasificaci&oacute;n o evaluaci&oacute;n a un conjunto de variables o atributos (Ruiz, 2008).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las reglas permiten  expresar disyunciones de manera m&aacute;s f&aacute;cil que los &aacute;rboles y tienden a  preferirse con respecto a estos por mostrar &ldquo;partes&rdquo; de conocimientos relativamente  independientes. Representan funciones que establecen una relaci&oacute;n entre los  ejemplos (descritos mediante un conjunto de rasgos) y las clases de decisi&oacute;n.  Se expresan de la forma If P then Q, donde P es la parte condicional formada  usualmente por una conjunci&oacute;n de condiciones elementales, y Q es la parte de decisi&oacute;n  que asigna un valor de decisi&oacute;n (clase) a un objeto que cumpla la condici&oacute;n.  Las reglas constituyen patrones que establecen una dependencia entre los  valores de los atributos de condici&oacute;n en P y el valor de decisi&oacute;n Q (Filiberto; Bello; Caballero, 2011).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Algunos de los beneficios de las reglas de inducci&oacute;n es  que son las representaciones de hip&oacute;tesis m&aacute;s perceptibles para el hombre y el  formalismo m&aacute;s notorio de representaci&oacute;n del conocimiento, de ah&iacute; que sean muy  utilizadas en aplicaciones m&eacute;dicas. Es por ello que en la investigaci&oacute;n se  decide aplicar esta t&eacute;cnica, debido a que es muy descriptiva. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Algoritmos</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Existen un grupo de algoritmos que  utilizan como base los datos de tipo nominal, entre ellos se encuentran: tabla  de decisi&oacute;n, ID3, C4.5, PART y el OneR; siendo este &uacute;ltimo uno de los  algoritmos implementados para PostgreSQL dentro de las reglas de inducci&oacute;n. El  OneR est&aacute; basado en el algoritmo ID3, donde la meta principal consiste en adquirir  las reglas de clasificaci&oacute;n directamente desde el conjunto de datos de  entrenamiento (Gasparovica; Aleksejeva, 2010). Es por tanto el algoritmo de clasificaci&oacute;n seleccionado ya  que es simple y efectivo, de uso frecuente en el aprendizaje de m&aacute;quinas,  utiliza un &uacute;nico atributo para la clasificaci&oacute;n, el cual es el de menor  porciento de error y se obtiene un conjunto de reglas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Si existen&nbsp;atributos  num&eacute;ricos, busca los umbrales para hacer reglas con mejor tasa de aciertos (Witten,  2005).&nbsp;Al utilizar un clasificador, su precisi&oacute;n y fiabilidad depende  principalmente de los casos clasificados&nbsp;correctamente a partir del n&uacute;mero  total de elementos (fase de evaluaci&oacute;n e interpretaci&oacute;n de resultados).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Adem&aacute;s permite analizar atributos con valores nominales,  pues en el negocio donde se va a aplicar, los valores de los atributos  seleccionados no presentan valores continuos, ni se trabaja con fechas, horas y  las tuplas con valores desconocidos se eliminaron previamente.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Herramienta  seleccionada para aplicar </strong></a><strong>el algoritmo OneR.</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para aplicar el algoritmo OneR  existen diversas herramientas; algunas son independientes del Sistema Gestor de  Bases de Datos (SGBD) y otras son nativas de un SGBD espec&iacute;fico. Dentro de las  herramientas nativas del gestor se pueden encontrar Oracle Server Data Mining y  Oracle Data Mining. Adem&aacute;s est&aacute;n las independientes del gestor como son Clementine de SPSS, Weka (<em>Waikato Environment for Knowledge Analysis</em>)  y SAS Enterprise Miner (Rodr&iacute;guez, 2009). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Teniendo en cuenta que es muy  beneficioso aplicar el algoritmo en el mismo SGBD, se utiliz&oacute; el PostgreSQL con  el auxilio de una extensi&oacute;n que contiene la implementaci&oacute;n de varios algoritmos  de miner&iacute;a de datos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">De esta forma el proceso es menos engorroso ya que el  tiempo para la preparaci&oacute;n y vinculaci&oacute;n de los datos es m&iacute;nimo, acortando el  tiempo de respuesta de los an&aacute;lisis (Robles, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tambi&eacute;n se hace uso de la  herramienta pgAdmin III ya que es un cliente gr&aacute;fico para el SGBD PostgreSQL,  es multiplataforma y permite gestionar todos los objetos de la base de datos e  incluye un editor SQL con resaltado de sintaxis (PostgreSQL,  2011). </font></p>     <p><font size="2"><a><strong><font face="Verdana, Arial, Helvetica, sans-serif">Metodolog&iacute;a aplicada</font></strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para realizar la extracci&oacute;n de  conocimiento &uacute;til a partir de los datos almacenados existen metodolog&iacute;as que  permiten llevar a cabo el proceso de miner&iacute;a de datos en forma sistem&aacute;tica y no  tribial. Dentro de las existentes se destacan SEMMA y CRISP-DM. La primera se  centra en las caracter&iacute;sticas t&eacute;cnicas del desarrollo del proceso y la segunda  realiza un an&aacute;lisis global del negocio al cual se le va a aplicar, por lo que  la investigaci&oacute;n se desarrolla bajo esta &uacute;ltima. CRISP-DM (de las siglas en  ingl&eacute;s Cross-Industry Standard Process for Data Mining) contiene 6 fases  encargadas de analizar el problema, analizar los datos, prepararlos, realizar  la modelaci&oacute;n, la evaluaci&oacute;n y la explotaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la primera fase, comprensi&oacute;n del problema,  esta metodolog&iacute;a propone el estudio de los objetivos y requerimientos del  proyecto para definir un plan preliminar para alcanzar las metas. En la fase de  comprensi&oacute;n de los datos se recolectan los que se van a utilizar, se describen  y se verifica la calidad de los mismos. La fase de preparaci&oacute;n incluye la  integraci&oacute;n, selecci&oacute;n, limpieza y transformaci&oacute;n de los datos. En la fase de  modelaci&oacute;n se seleccionan las t&eacute;cnicas y algoritmos a utilizar en dependencia  del objetivo a resolver, luego se procede a evaluar comprobando que se cumplan  los objetivos del negocio y por &uacute;ltimo se le presentan a los especialistas informes  sobre el conocimiento extra&iacute;do.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Implementaci&oacute;n e integraci&oacute;n del algoritmo OneR</strong></a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la implementaci&oacute;n del algoritmo OneR se asumi&oacute; el resultado de la Tesis de Maestr&iacute;a de Yadira Robles en el a&ntilde;o 2012, donde utiliz&oacute; el lenguaje Pl/pgsql en la realizaci&oacute;n de una funci&oacute;n que toma  como entrada el nombre de la tabla y la clase sobre la cual se va a realizar el  an&aacute;lisis, y devuelve como resultados un  conjunto de reglas para los atributos con la menor cantidad de errores.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La integraci&oacute;n de dicho algoritmo se realiz&oacute; mediante  una extensi&oacute;n creada para PostgreSQL. La extensi&oacute;n contiene dos archivos, uno  que define las caracter&iacute;sticas de la misma y el otro los objetos SQL que fueron  agregados (Robles, 2012). Ambos archivos fueron ubicados dentro del directorio  de la instalaci&oacute;n &ldquo;/usr/share/postgresql/9.3/extension/&rdquo;. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una vez analizado el algoritmo seleccionado perteneciente a las t&eacute;cnicas de  clasificaci&oacute;n, las herramientas que lo soportan, la integraci&oacute;n a estas, y la  metodolog&iacute;a a utilizar se exponen los resultados alcanzados durante la  investigaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Comprensi&oacute;n del negocio</strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los objetivos del  negocio est&aacute;n enmarcados a:</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Conocer las relaciones que se establecen  entre las caracter&iacute;sticas de los pacientes.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Determinar cu&aacute;les son las  caracter&iacute;sticas de las personas que pueden influir en el grado los eventos  adversos.</font></p>   </li>     ]]></body>
<body><![CDATA[</ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como objetivo de la  miner&iacute;a de datos se identific&oacute;:</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Obtener reglas que determinen el par&aacute;metro m&aacute;s significativo, as&iacute; como  la influencia que tiene en el grado de los eventos adversos, analizando la  edad, el sexo, el peso, la raza y la enfermedad base del paciente. </font></p>   </li>     </ul>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><a><font size="2"><strong>Comprensi&oacute;n de los datos</strong></font></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La comprensi&oacute;n de los datos est&aacute; relacionada con la  recolecci&oacute;n y descripci&oacute;n de la informaci&oacute;n que contiene la base de datos  resultado de la tesis de diploma realizada en el 2013 por la autora del  presente trabajo.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La informaci&oacute;n recopilada fue obtenida de una &uacute;nica fuente,  que de manera centralizada es la que contiene todos los datos de los pacientes  que participaron en los Ensayos Cl&iacute;nicos del producto LeukoCIM. Esta base de  datos cuenta con 33 tablas contenidas en tres esquemas (Cardoso, 2013).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A continuaci&oacute;n, se describen los atributos  significativos para darle soluci&oacute;n a los objetivos propuestos en el ep&iacute;grafe  Comprensi&oacute;n del negocio. <a href="/img/revistas/rcci/v11n2/t0105217.jpg" target="_blank">Ver Tabla 1 </a></font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Explorar y verificar la calidad de  los datos</font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Teniendo en cuenta que los datos utilizados para la  aplicaci&oacute;n del algoritmo fueron extra&iacute;dos de un mercado de datos, estos se  encuentran estructurados, integrados y sin ruidos. Se comprob&oacute; que de las 145  688 tuplas contenidas en 33 tablas no exist&iacute;an valores nulos ni duplicados.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Preparaci&oacute;n de los datos</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Selecci&oacute;n de los datos</em></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">De los atributos vistos en el ep&iacute;grafe Comprensi&oacute;n de los  datos, se excluy&oacute; de la selecci&oacute;n el denominado dk_codigo_paciente, que se  emple&oacute; solo como enlace entre las tablas. Este presenta gran variabilidad ya  que cada instancia es &uacute;nica.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em><strong>Limpieza  y transformaci&oacute;n de los datos</strong></em></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la limpieza de los datos se realiz&oacute; un perfilado a  los mismos, lo que permite comprender su contenido, estructura, calidad y  dependencias.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para un mayor entendimiento en el trabajo con los valores de los atributos  se realizaron las siguientes transformaciones:</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los valores  del sexo que aparec&iacute;an con 1 y 2 se sustituyeron por Masculino y Femenino  respectivamente.</font></p>   </li>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los valores  de la raza que aparec&iacute;an con 1, 2, 3 y 4 se sustituyeron por Blanca, Negra,  Mestiza y Amarilla respectivamente.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los valores  del grado del evento adverso seg&uacute;n la Organizaci&oacute;n Mundial de la Salud (OMS) que  aparec&iacute;an con 1, 2, 3, 4, 5, 6 y 7 se sustituyeron por Normal, Ligero,  Moderado, Severo, Que amenaza la vida, Que causa la muerte y Muy severo  respectivamente.</font></p>   </li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em><strong>Integraci&oacute;n  de datos</strong></em></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los campos seleccionados se  encontraban en diferentes tablas por lo cual se realiz&oacute; una consulta uniendo  los atributos necesarios para dar cumplimiento al objetivo del negocio,  cre&aacute;ndose una nueva tabla como resultado de una vista que contiene 476  registros con un total de cinco campos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Modelado</strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La selecci&oacute;n de las t&eacute;cnicas de miner&iacute;a de datos y el algoritmo a emplear  depende de los objetivos de miner&iacute;a de datos propuestos en la fase de  comprensi&oacute;n del negocio. La t&eacute;cnica seleccionada para darle cumplimiento a este  objetivo es la de reglas de inducci&oacute;n y de ellas el algoritmo OneR.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para obtener las reglas mediante dicho algoritmo integrado al SGBD  PostgreSQL, se realiz&oacute; la siguiente consulta &ldquo;SELECT * FROM &quot;1r&quot; ('  pgday ',' grado_evento_adverso ') as (atributo varchar, valor varchar, error  real, errortotal real)&rdquo;, haciendo referencia a la funci&oacute;n implementada  pas&aacute;ndole como par&aacute;metros el nombre de la tabla y el atributo clase, el cual va  a ser por el que se va a analizar la tabla. (<a href="/img/revistas/rcci/v11n2/f0105217.jpg" target="_blank">Ver Figura 1</a>). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Al aplicar el algoritmo  OneR se obtuvieron estos resultados los cuales se interpretan de la siguiente  forma:</font></p> <ol>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Si la enfermedad base del paciente es  Linfoma de Hodgkin la influencia del grado del evento adverso es Normal.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Si la enfermedad base del paciente es  Linfoma Cut&aacute;neo de C&eacute;lulas T la influencia del grado del evento adverso es  Severo.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Si la enfermedad base del paciente es  S&iacute;ndrome Dismielopoy&eacute;tico la influencia del grado del evento adverso es Normal.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Si la enfermedad base del paciente es  Osteosarcoma de F&eacute;mur la influencia del grado del evento adverso es Ligero.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Si la enfermedad base del paciente es  Neoplasia de Mama con Met&aacute;stasis Pulmonar la influencia del grado del evento  adverso es Ligero.</font></p>   </li>     ]]></body>
<body><![CDATA[</ol>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El resto de los resultados se interpretan de la misma manera, teniendo en  cuenta que el n&uacute;mero que antecede el grado del evento adverso se refiere a la  llave primaria del atributo dk_dim_enfermedad_base_id.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Evaluaci&oacute;n e implementaci&oacute;n</strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este proceso de evaluaci&oacute;n de los resultados, se realizaba por parte de los  especialistas del CIM a trav&eacute;s de los Cuadernos de Recogida de Datos, que  posteriormente eran insertados en un sistema llamado EpiData y finalmente lo  exportaban al formato Excel provocando m&aacute;rgenes de errores elevados y tiempo  considerable. Es por ello que se desarrolla el mercado de datos con el mismo objetivo  del negocio relacionado con el descubrimiento de patrones ocultos en los datos.  Con la aplicaci&oacute;n del algoritmo OneR se logra clasificar el grado del evento  adverso, basado en las relaciones que se establecen entre los atributos  seleccionados. Por lo que puede considerarse el modelo como aceptado, desde el  punto de vista anal&iacute;tico, para apoyar la toma de decisiones m&eacute;dicas y administrativas  del CIM.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la presente investigaci&oacute;n se aplic&oacute; el algoritmo OneR a trav&eacute;s de la  integraci&oacute;n de la extensi&oacute;n realizada para el SGBD PostgreSQL. Se analiz&oacute; la  t&eacute;cnica de clasificaci&oacute;n y su v&iacute;nculo con el algoritmo en cuesti&oacute;n. Con la gu&iacute;a  de la metodolog&iacute;a CRISP-DM se llev&oacute; a cabo el proceso de miner&iacute;a de datos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La informaci&oacute;n descubierta a partir de la aplicaci&oacute;n del algoritmo OneR,  permite a los directivos del Centro de Inmunolog&iacute;a Molecular emprender las  acciones y determinar, si as&iacute; lo estiman conveniente, una estrategia a seguir en  la administraci&oacute;n del producto LeukoCIM que posibilite elevar el nivel de vida  de los pacientes que lo consumen.</font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BAKKE OM, CARN&Eacute; X, GARC&Iacute;A ALONSO F. Investigaci&oacute;n y desarrollo de nuevos f&aacute;rmacos.  En: Bakke OM, Carn&eacute; X, Garc&iacute;a-Alonso F (ed). Ensayos cl&iacute;nicos con medicamentos.  Mosby/Doyma Libros, Madrid, 1994: 45-55.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CARDOSO GARC&Iacute;A, Y. Subsistemas de almacenamiento e integraci&oacute;n LeukoCIM para el almac&eacute;n de  datos de los Ensayos Cl&iacute;nicos del Centro de Inmunolog&iacute;a Molecular. La  Habana: Trabajo de Diploma para optar por el t&iacute;tulo de Ingeniero en Ciencias  Inform&aacute;ticas, 2013.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CASTILLO MOREIRA, M.M. Evaluaci&oacute;n emp&iacute;rica del Acoplamiento de Algoritmos  de Miner&iacute;a de Datos a un Sistema Gestor de Base de Datos. Chile: Tesis  presentada en opci&oacute;n al t&iacute;tulo de M&aacute;ster en Ingenier&iacute;a Inform&aacute;tica, 2014.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">FILIBERTO, Y.; BELLO, R.; CABALLERO, Y. Algoritmo para el aprendizaje de  reglas de clasificaci&oacute;n basado en la teor&iacute;a de los conjuntos aproximados  extendida. No. 169, Medell&iacute;n:  Revista DYNA, 2011, Vol. 78, 2011.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GASPAROVICA, M.; ALEKSEJEVA, L. Using Fuzzy Algorithms for Modular Rules.  Scientific Journal of Riga Technical University Computer Science. Information  Technology and Management Science. 2010. p&aacute;gs. 94-98.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">IBM. Big Data and analytics  platform. Disponible en:  http://www-01.ibm. com/software/data/bigdata, 2012.</font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MINISTERIO  DE SALUD P&Uacute;BLICA. Centro para el control estatal de la calidad de los  medicamentos. Regulaci&oacute;n No. 45-2007. [En l&iacute;nea] 2009. [Citado el: 4 de marzo  de 2015] http://www.bvv.sld.cu.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MOLINA L&Oacute;PEZ, J. M.; GARC&Iacute;A HERRERO, J. T&eacute;cnicas de an&aacute;lisis de datos.  2006.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">POSTGRESQL. [En l&iacute;nea] 12 de  septiembre de 2011. [Citado el: 13 de septiembre de 2015.] http://www.postgresql.org/about/press/presskit91/es/.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">RODR&Iacute;GUEZ SU&Aacute;REZ, Y. Herramientas de  Miner&iacute;a de Datos. La Habana&nbsp;: Revista Cubana de Ciencias Inform&aacute;ticas,  2009.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ROBLES ARANDA, Y. Propuesta de integraci&oacute;n de las t&eacute;cnicas de  miner&iacute;a de datos &Aacute;rboles de decisi&oacute;n y reglas de inducci&oacute;n al Sistema Gestor de  Base de Datos. La Habana&nbsp;: UCIENCIA, 2012.    </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ROBLES ARANDA, Y. Algoritmos de miner&iacute;a de datos: &Aacute;rboles de decisi&oacute;n y reglas de  inducci&oacute;n integrados a PostgreSQL. La Habana: Tesis presentada en opci&oacute;n  al t&iacute;tulo de M&aacute;ster en Inform&aacute;tica Aplicada, 2012.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">RUIZ, OMAR. Aplicaci&oacute;n de miner&iacute;a de datos para  detecci&oacute;n de patrones en investigaciones biotecnol&oacute;gicas. s.l.&nbsp;:  Revista Espol Ciencia, 2008.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">USAMA FAYYAD, G. Data Mining and Knowledge Discovery  in Databases: An overview, Communications of ACM. [En l&iacute;nea] 1996. [Citado el: 14 de abril de 2015.]  http://dl.acm.org/citation.cfm?id=240464.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WITTEN, IH AND FRANK, E.  &quot;Data Mining: Practical Machine Learning Tools and Techniques&quot;, 2nd  Edition. Morgan Kaufmann, 2005.     </font></p>     <p>&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 17/05/2016    <br> Aceptado: 09/02/2017</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BAKKE]]></surname>
<given-names><![CDATA[OM]]></given-names>
</name>
<name>
<surname><![CDATA[CARNÉ]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[GARCÍA ALONSO]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<source><![CDATA[Investigación y desarrollo de nuevos fármacos]]></source>
<year>1994</year>
<page-range>45-55</page-range><publisher-loc><![CDATA[^eMadrid Madrid]]></publisher-loc>
<publisher-name><![CDATA[Mosby/Doyma Libros]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CARDOSO GARCÍA]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Subsistemas de almacenamiento e integración LeukoCIM para el almacén de datos de los Ensayos Clínicos del Centro de Inmunología Molecular]]></source>
<year>2013</year>
<publisher-loc><![CDATA[^eLa Habana La Habana]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CASTILLO MOREIRA]]></surname>
<given-names><![CDATA[M.M]]></given-names>
</name>
</person-group>
<source><![CDATA[Evaluación empírica del Acoplamiento de Algoritmos de Minería de Datos a un Sistema Gestor de Base de Datos.]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FILIBERTO]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[BELLO]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[CABALLERO]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Algoritmo para el aprendizaje de reglas de clasificación basado en la teoría de los conjuntos aproximados extendida]]></source>
<year>2011</year>
<volume>Vol. 78</volume>
<publisher-loc><![CDATA[^eMedellín Medellín]]></publisher-loc>
<publisher-name><![CDATA[Revista DYNA]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GASPAROVICA]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[ALEKSEJEVA]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[Using Fuzzy Algorithms for Modular Rules.]]></source>
<year>2010</year>
<page-range>94-98</page-range><publisher-name><![CDATA[Scientific Journal of Riga Technical University Computer Science]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<collab>IBM</collab>
<source><![CDATA[Big Data and analytics platform]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<collab>MINISTERIO DE SALUD PÚBLICA</collab>
<source><![CDATA[Centro para el control estatal de la calidad de los medicamentos]]></source>
<year>2009</year>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MOLINA LÓPEZ]]></surname>
<given-names><![CDATA[J. M]]></given-names>
</name>
<name>
<surname><![CDATA[GARCÍA HERRERO]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Técnicas de análisis de datos]]></source>
<year>2006</year>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<collab>POSTGRESQL</collab>
<source><![CDATA[En línea]]></source>
<year>12 d</year>
<month>e </month>
<day>se</day>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RODRÍGUEZ SUÁREZ]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Herramientas de Minería de Datos]]></source>
<year>2009</year>
<publisher-loc><![CDATA[^eLa Habana La Habana]]></publisher-loc>
<publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ROBLES ARANDA]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Propuesta de integración de las técnicas de minería de datos Árboles de decisión y reglas de inducción al Sistema Gestor de Base de Datos.]]></source>
<year>2012</year>
<publisher-loc><![CDATA[^eLa Habana La Habana]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ROBLES ARANDA]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Algoritmos de minería de datos: Árboles de decisión y reglas de inducción integrados a PostgreSQL.]]></source>
<year>2012</year>
<publisher-loc><![CDATA[^eLa Habana La Habana]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RUIZ]]></surname>
<given-names><![CDATA[OMAR]]></given-names>
</name>
</person-group>
<source><![CDATA[Aplicación de minería de datos para detección de patrones en investigaciones biotecnológicas]]></source>
<year>2008</year>
<publisher-name><![CDATA[Revista Espol Ciencia]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[USAMA FAYYAD]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Mining and Knowledge Discovery in Databases: An overview, Communications of ACM]]></source>
<year>1996</year>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WITTEN]]></surname>
<given-names><![CDATA[IH]]></given-names>
</name>
<name>
<surname><![CDATA[FRANK]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Mining: Practical Machine Learning Tools and Techniques]]></source>
<year>2005</year>
<edition>2nd Edition</edition>
<publisher-name><![CDATA[Morgan Kaufmann]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
