<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000300011</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Evaluación del perfil neurotóxico de líquidos iónicos usando técnicas de aprendizaje supervisado]]></article-title>
<article-title xml:lang="en"><![CDATA[Evaluation of the Neurotoxic Profile of Ionic Liquids Based using Supervised Machine Learning Techniques]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Cruz Monteagudo]]></surname>
<given-names><![CDATA[Maykel]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Dominguez López]]></surname>
<given-names><![CDATA[Rotceh]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Céspedes Pérez]]></surname>
<given-names><![CDATA[Ariel]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Pérez Guzmán]]></surname>
<given-names><![CDATA[Ricardo Enrique]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de Porto  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Portugal</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad de Las Tunas  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>3</numero>
<fpage>127</fpage>
<lpage>143</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000300011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000300011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000300011&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN La enzima Acetilcolinesterasa (AChE) juega un papel imprescindible en la hidrólisis del neurotransmisor Acetilcolina, el cual es el responsable de la transmisión de los impulsos nerviosos. Desde la década de los 30, especialistas en las ciencias químicas han producido compuestos que son capaces de inhibir esta enzima y por tanto afectar el proceso de transmisión de los impulsos nerviosos, lo cual provoca consecuencias graves para el organismo afectado. Estudios actuales han demostrado que algunos líquidos iónicos pueden inhibir el funcionamiento de la enzima AChE y provocar daños al sistema nervioso central. Los líquidos iónicos debido a sus características físico -químicas son ampliamente utilizados en la producción de solventes que son utilizados en la sustitución de solventes moleculares tóxicos para el medio ambiente. En correspondencia con esto surge la necesidad de evaluar el perfil neurotóxico de los líquidos iónicos utilizando la enzima AChE como indicador de neurotoxicidad. En el desarrollo del trabajo se aplicaron multiclasificadores, como técnicas de aprendizaje supervisado, y como resultado se obtuvieron modelos capaces de predecir si un nuevo líquido iónico es capaz de inhibir la AChE. El multiclasificador AdaBoostM1, que utiliza una red neuronal MultilayerPerceptron como clasificador base y el multiclasificador Stacking, que utiliza la combinación de clasificadores FDLA, Jrip, Kstar, NaiveBayes y SMO como clasificadores bases, fueron los multiclasificadores seleccionados.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT The enzyme Acetylcholinesterase (AChE) plays an essential role in the hydrolysis of the neurotransmitter Acetylcholine, which is responsible for the transmission of nerve impulses. Since the 1930s, specialists in the chemical sciences have produced compounds that are able to inhibit this enzyme and therefore affect the transmission process of nerve impulses, which causes serious consequences for the affected organism. Current studies have shown that some ionic liquids can inhibit AChE enzyme function and cause damage to the central nervous system. Ionic liquids due to their physical-chemical characteristics are widely used in the production of solvents that are used in the substitution of molecular toxic solvents for the environment. In correspondence to this arises the need to evaluate the neurotoxic profile of ionic liquids using the AChE enzyme as an indicator of neurotoxicity. In the development of the work multiclassifiers were applied as supervised learning techniques, and as a result models were obtained capable of predicting if a new ionic liquid is able to inhibit AChE. Bagging, Boosting, Stacking and Vote multiclassifiers were used in the experimentation to identify predictive QSAR models. Five measures of diversity were calculated for the base classifiers used in Stacking and Vote multiclassifiers. Finally, two models were obtained that surpassed the performance of the individual classifiers used, reason why they were selected to solve the problem. The multiclassifier AdaBoostM1, which uses a Multilayer Perceptron neural network as the base classifier and the Stacking multiclaser, which uses the combination of classifiers FDLA, Jrip, Kstar, NaiveBayes and SMO as base classifiers, were the multiclasifiers selected.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Acetilcolinesterasa]]></kwd>
<kwd lng="es"><![CDATA[líquidos iónicos]]></kwd>
<kwd lng="es"><![CDATA[QSAR]]></kwd>
<kwd lng="es"><![CDATA[multiclasificadores]]></kwd>
<kwd lng="es"><![CDATA[medidas de diversidad]]></kwd>
<kwd lng="en"><![CDATA[Acetylcholinesterase]]></kwd>
<kwd lng="en"><![CDATA[ionic liquids]]></kwd>
<kwd lng="en"><![CDATA[QSAR]]></kwd>
<kwd lng="en"><![CDATA[ensembles]]></kwd>
<kwd lng="en"><![CDATA[diversity measures]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Evaluaci&oacute;n  del perfil neurot&oacute;xico de l&iacute;quidos i&oacute;nicos usando t&eacute;cnicas de aprendizaje  supervisado</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><em><font face="Verdana, Arial, Helvetica, sans-serif">Evaluation of the Neurotoxic  Profile of Ionic Liquids Based using Supervised Machine Learning Techniques</font></em></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Maykel Cruz Monteagudo</font> <font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>1*</sup></strong>, Rotceh Dominguez L&oacute;pez<strong><sup>2</sup></strong>, Ariel C&eacute;spedes P&eacute;rez</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup></strong></font><strong><font face="Verdana, Arial, Helvetica, sans-serif">, Ricardo Enrique P&eacute;rez Guzm&aacute;n</font> </strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup></strong></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Universidad de Porto, gmaikelcm@yahoo.com, Portugal     <br>     <sup>2</sup>Universidad de Las Tunas, {rdominl2003,  arielcespedes87}@gmail.com, {arces,  ricardopg}@ult.edu.cu, Cuba.</font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span><font size="2">rielcespedes87@gmail.com </font></font>      <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La enzima Acetilcolinesterasa (AChE) juega un papel  imprescindible en la hidr&oacute;lisis del neurotransmisor Acetilcolina, el cual es el  responsable de la transmisi&oacute;n de los impulsos nerviosos. Desde la d&eacute;cada de los  30, especialistas en las ciencias qu&iacute;micas han producido compuestos que son capaces  de inhibir esta enzima y por tanto afectar el proceso de transmisi&oacute;n de los  impulsos nerviosos, lo cual provoca consecuencias graves para el organismo  afectado. Estudios actuales han demostrado que algunos l&iacute;quidos i&oacute;nicos pueden  inhibir el funcionamiento de la enzima AChE y provocar da&ntilde;os al sistema  nervioso central. Los l&iacute;quidos i&oacute;nicos debido a sus caracter&iacute;sticas f&iacute;sico  &ndash;qu&iacute;micas son ampliamente utilizados en la producci&oacute;n de solventes que son  utilizados en la sustituci&oacute;n de solventes moleculares t&oacute;xicos para el medio  ambiente. En correspondencia con esto surge la necesidad de evaluar el perfil  neurot&oacute;xico de los l&iacute;quidos i&oacute;nicos utilizando la enzima AChE como indicador de  neurotoxicidad. En el desarrollo del trabajo se aplicaron multiclasificadores,  como t&eacute;cnicas de aprendizaje supervisado, y como resultado se obtuvieron  modelos capaces de predecir si un nuevo l&iacute;quido i&oacute;nico es capaz de inhibir la  AChE. El multiclasificador AdaBoostM1, que utiliza una red neuronal  MultilayerPerceptron como clasificador base y el multiclasificador Stacking,  que utiliza la combinaci&oacute;n de clasificadores FDLA, Jrip, Kstar, NaiveBayes y  SMO como clasificadores bases, fueron los multiclasificadores seleccionados.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Acetilcolinesterasa,  l&iacute;quidos i&oacute;nicos, QSAR, multiclasificadores, medidas de diversidad. </font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">The enzyme Acetylcholinesterase (AChE) plays an essential role in the  hydrolysis of the neurotransmitter Acetylcholine, which is responsible for the  transmission of nerve impulses. Since the 1930s, specialists in the chemical  sciences have produced compounds that are able to inhibit this enzyme and  therefore affect the transmission process of nerve impulses, which causes  serious consequences for the affected organism. Current studies have shown that  some ionic liquids can inhibit AChE enzyme function and cause damage to the  central nervous system. Ionic liquids due to their physical-chemical  characteristics are widely used in the production of solvents that are used in  the substitution of molecular toxic solvents for the environment. In  correspondence to this arises the need to evaluate the neurotoxic profile of  ionic liquids using the AChE enzyme as an indicator of neurotoxicity. In the  development of the work multiclassifiers were applied as supervised learning  techniques, and as a result models were obtained capable of predicting if a new  ionic liquid is able to inhibit AChE. Bagging, Boosting, Stacking and Vote  multiclassifiers were used in the experimentation to identify predictive QSAR  models. Five measures of diversity were calculated for the base classifiers  used in Stacking and Vote multiclassifiers. Finally, two models were obtained  that surpassed the performance of the individual classifiers used, reason why  they were selected to solve the problem. The multiclassifier AdaBoostM1, which  uses a Multilayer Perceptron neural network as the base classifier and the  Stacking multiclaser, which uses the combination of classifiers FDLA, Jrip,  Kstar, NaiveBayes and SMO as base classifiers, were the multiclasifiers  selected.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>Acetylcholinesterase,  ionic liquids, QSAR, ensembles, diversity measures</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La acetilcolina  (ACh) es un neurotransmisor en muchas sinapsis colin&eacute;rgicas del sistema  nervioso aut&oacute;nomo (J. Koolman 2005). La acetilcolinesterasa (AChE)  es una esterasa que hidroliza a la acetilcolina despu&eacute;s de que &eacute;sta ha  realizado su funci&oacute;n en la uni&oacute;n de receptores. La funci&oacute;n normal de la ACh  depende de su r&aacute;pida hidr&oacute;lisis por la AChE, que permite la brevedad y unidad  de los impulsos nerviosos propagados sincr&oacute;nicamente (Mathews. 2005).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La inhibici&oacute;n de  la enzima AChE provoca que la acetilcolina unida a los receptores presentes en  la membrana postsin&aacute;ptica no sea liberada r&aacute;pidamente, como consecuencia la  acelticolina sigue siendo producida como parte de la transmisi&oacute;n de los nuevos  impulsos nerviosos sin embargo los receptores no son capaces de recibir los  nuevos impulsos el&eacute;ctricos emitidos por las neuronas vecinas (debido a que la  AChE no hidroliza los neurotransmisores ACh) provocando efectos adversos tales  como: enfermedades cardiovasculares, debilidad muscular y en ocasiones la  muerte (Metzler 2003; Stock<em> y cols.</em> 2004). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los l&iacute;quidos  i&oacute;nicos (LI) constituyen un &aacute;rea de las ciencias qu&iacute;micas que han estado atrayendo  la atenci&oacute;n entre los investigadores debido a las caracter&iacute;sticas  f&iacute;sico-qu&iacute;micas &uacute;nicas de estos compuestos que proveen un amplio rango de  aplicaciones (St&ouml;rmann<em> y cols.</em> 2014). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El n&uacute;mero de  posibles combinaciones de aniones y cationes que pudieran componer un LI est&aacute;  por el orden de los 1018 (Arning, S. S. J.<em> y  cols.</em> 2008). Los LI son catalogados como  &ldquo;verdes&rdquo; y la raz&oacute;n consiste generalmente en tres argumentos: i) poseen una  presi&oacute;n de vapor muy baja que proporciona una reducci&oacute;n de la exposici&oacute;n por  inhalaci&oacute;n en el personal que trabaja con &eacute;l, en comparaci&oacute;n con disolventes  moleculares convencionales; ii) no son inflamables, lo que reduce fuertemente  el riesgo de oxidaciones exot&eacute;rmicas r&aacute;pidas y iii) se consideran no t&oacute;xicos.  La mayor parte de los investigadores expresan su desacuerdo con la &uacute;ltima  caracter&iacute;stica y la justificaci&oacute;n de su discrepancia se encuentra plasmada en  varios art&iacute;culos (Frade y Exp. 2010; Garc&iacute;a-Lorenzo<em> y cols.</em> 2008; Zhao y Zhang 2007) . Un creciente  n&uacute;mero de estudios, que analizan el peligro de diferentes LI, ha sido  realizados y determinados en diferentes sistemas de pruebas biol&oacute;gicas (J. P. J. S. Torrecilla 2010; Sierra; Mart&iacute; y  Crua&ntilde;as 2006). A partir de los resultados de  estas investigaciones se demuestra que existen LI que poseen un peligro  potencial para el hombre y para el medioambiente. Dentro del conjunto de  sistemas de pruebas realizadas se encuentra el estudio denominado &ldquo;Ensayos  sobre inhibici&oacute;n de la enzima Acetilcolinesterasa&rdquo;, realizado a partir de la  enzima purificada de la manta el&eacute;ctrica <em>Electrophorus  electricus</em>, apoyados los estudios QSAR (St&ouml;rmann<em> y cols.</em> 2014). Esta prueba se realiza teniendo  en cuenta que esta enzima es parte esencial del sistema nervioso central de los  organismos complejos (Stock<em> y cols.</em> 2004). Los resultados de este estudio permitieron  determinar que los LI pueden inhibir la enzima y como consecuencia provocar efectos  no deseados. Los resultados de los ensayos in vivo son un indicador de que la  AChE de otros organismos tambi&eacute;n puede ser inhibida (Stock<em> y cols.</em> 2004).Como resultado de las  investigaciones sobre el efecto inhibitorio de los LI sobre la AChE se ha  generado un gran volumen de registros que describen las caracter&iacute;sticas  estructurales de los LI ya sintetizados y la actividad biol&oacute;gica que tienen  sobre la AChE. Teniendo en cuenta que la mayor&iacute;a de los LI a&uacute;n no han sido  sintetizados, es necesario desarrollar m&eacute;todos para predecir el peligro  potencial de LI desconocidos con el objetivo de facilitar el dise&ntilde;o de nuevos  materiales seguros y reducir la necesidad de realizar las s&iacute;ntesis de LI  basados en el m&eacute;todo de prueba y error, y de esta forma disminuir los costos y  el tiempo de su producci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La computaci&oacute;n,  como herramienta, complementa la realizaci&oacute;n de estudios que, a partir del uso  de simulaciones o procesamiento de grandes vol&uacute;menes de datos, que de forma  manual ser&iacute;a poco factible realizar. El aprendizaje autom&aacute;tico es un &aacute;rea de la  computaci&oacute;n (espec&iacute;ficamente de la inteligencia artificial) en la que el hombre  ha obtenido buenos resultados aplicada al procesamiento de grandes vol&uacute;menes de  informaci&oacute;n y en la actualidad est&aacute; comenzando a ser aplicada con &eacute;xito en  problemas similares en la rama de la qu&iacute;mica. En este sentido, pocos art&iacute;culos  relacionados con herramientas computacionales y su utilizaci&oacute;n para la  predicci&oacute;n de la toxicidad de los LI han sido reportados en la literatura, (Arning, S. S. J.<em> y  cols.</em> 2008; Couling<em> y cols.</em> 2006; Garc&iacute;a-Lorenzo<em> y cols.</em> 2008; Hossain<em> y cols.</em> 2011; Izadiyan 2011; Lacrama 2007; Luis, A. G. P. y  Irabien 2010; Luis, I. O. P.; Aldaco y Irabien 2007; Mohammad y Fatemi  2011; Putz 2007; Torrecilla<em> y cols.</em> 2010)  en particular  aquellos relacionados con el potencial inhibitorio de los LI sobre la enzima  AChE, como un problema de clasificaci&oacute;n.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  desarrollo del trabajo se realiz&oacute; aplicando un enfoque de miner&iacute;a de datos. Se  ejecutaron las etapas del proceso de extracci&oacute;n del conocimiento en base de  datos, con el objetivo de encontrar modelos que permitan identificar patrones a  partir de la informaci&oacute;n actual y a partir de esta predecir el peligro  potencial de LI desconocidos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Colecci&oacute;n y estandarizaci&oacute;n de los datos</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  datos utilizados fueron obtenidos de la Base de datos de efectos biol&oacute;gicos de  LI pertenecientes a la UFT/Merck (Arning, S. S.  Jurgen y Boshen 2008; Stock<em> y cols.</em> 2004; St&ouml;rmann<em> y cols.</em> 2014) . En Tropsha y Muratov (2010), Tropsha y  colaboradores proponen una metodolog&iacute;a para preprocesar la informaci&oacute;n  relacionada con la estructura de mol&eacute;culas qu&iacute;micas que ser&aacute;n objeto de la  realizaci&oacute;n de estudios QSAR.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Proponen eliminar todas aquellas mol&eacute;culas que  poseen elementos met&aacute;licos, organomet&aacute;licos y elementos poco representados,  dejando fuera las mol&eacute;culas que contienen elementos que no son manejados por  las herramientas que calculan descriptores moleculares y aquellas que poseen  elementos poco representados que pudieran constituir ruidos en la fase de  aprendizaje. Los elementos poco representados son determinados con la  utilizaci&oacute;n del software Jchem (Chemaxon 2012) el cual  posee funciones para determinar los elementos que est&aacute;n contenidos en una  mol&eacute;cula y con esta informaci&oacute;n determinar el total de elementos que estaban  contenidos en las mol&eacute;culas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La  estructura qu&iacute;mica de cada mol&eacute;cula, que se encuentra codificada con SMILES1,  debe ser estandarizada debido a que en ocasiones un mismo grupo funcional puede  ser representado por diferentes patrones estructurales en un conjunto de datos  dado. Para los estudios QSAR esta situaci&oacute;n conduce hacia serios problemas  debido a que los descriptores moleculares calculados a partir de estas  representaciones diferentes del mismo grupo funcional pueden ser  significativamente distintos (Tropsha y Muratov 2010) de forma  que estos se calculan con si fueran mol&eacute;culas diferentes. La estandarizaci&oacute;n  estructural de las mol&eacute;culas se puede realizar utilizando la herramienta  ChemAxon&acute;s Standarizer (Chemaxon. 2012) debido a  que permite realizar normalizaciones de forma r&aacute;pida y eficiente (Tropsha y Muratov 2010). El  resultado de esta operaci&oacute;n permitir&aacute; identificar si existen duplicados de una  mol&eacute;cula y por lo tanto se est&aacute; en condiciones de realizar la eliminaci&oacute;n de  las mol&eacute;culas duplicadas, debido que pueden afectar la frecuencia observada de  una mol&eacute;cula y la distribuci&oacute;n de los compuestos acorde a su similaridad  estructural. Para la eliminaci&oacute;n de duplicados se utiliz&oacute; el software ISIDA&rsquo;s  EdiSDF (V. Solov&acute;Ep 2010), debido a  que es una herramienta libre y con fines acad&eacute;micos (Tropsha y Muratov 2010).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  c&aacute;lculo de los descriptores moleculares se realiz&oacute; utilizando la herramienta  ISIDA (Isida 2008),  permitiendo la obtenci&oacute;n de un vector num&eacute;rico que representa la ocurrencia de  fragmentos presentes en la mol&eacute;cula.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Posibilitando la obtenci&oacute;n de informaci&oacute;n  que podr&aacute; ser utilizadas por la herramienta de miner&iacute;a de datos a utilizar.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Dise&ntilde;o del experimento</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  conjunto de datos resultante recoge la informaci&oacute;n de 261 mol&eacute;culas, donde cada  mol&eacute;cula est&aacute; representada por 693 descriptores moleculares. Las mol&eacute;culas se  clasifican en dos grupos: 226 mol&eacute;culas t&oacute;xicas y 35 no t&oacute;xicas o seguras. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  conjunto de datos a utilizar como entrenamiento posee dos caracter&iacute;sticas que  obligan a continuar realizando acciones como parte de la etapa de  preprocesamiento. Estos datos poseen una alta dimensionalidad con respecto a la  cantidad de instancias que posee, lo que propicia problemas de sobreajuste en  la clasificaci&oacute;n y un desbalance entre la cantidad de instancias que conforman  los dos grupos en los que se clasifican estas mol&eacute;culas teniendo un &iacute;ndice de  desbalance IR=6.45 &nbsp;determinado mediante la raz&oacute;n entre las  ocurrencias de la clase mayoritaria y las ocurrencias de la clase minoritaria.  La realizaci&oacute;n de un entrenamiento con un conjunto de datos con estas  caracter&iacute;sticas provoca que el criterio de los clasificadores sea parcializado  a favor de las mol&eacute;culas m&aacute;s representadas.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Selecci&oacute;n de atributos, balanceo de datos y  modelaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  softwares que calculan los descriptores moleculares generan entre cientos y  miles de estos descriptores. En muchas ocasiones una gran parte de estos  descriptores es informaci&oacute;n redundante y poco &uacute;til en el proceso de extracci&oacute;n  del conocimiento. Por tal raz&oacute;n se hace necesario seleccionar aquellos  atributos que son relevantes para el problema en cuesti&oacute;n y de esta forma se  evita el riesgo de que los clasificadores se vean afectados por sobreajuste. La  selecci&oacute;n de atributos relevantes se realiza utilizando 3 enfoques: algoritmos filtros,  algoritmos envolventes, algoritmos h&iacute;bridos. En (Peng; Long y Ding 2005) se  explican las caracter&iacute;sticas de los algoritmos que perteneces a estas tres  clasificaciones. Para encaminar la soluci&oacute;n del problema se utiliz&oacute; el software  mRMR (Ramentol<em> y cols.</em> 2011), que  implementa una selecci&oacute;n de atributos usando un criterio de dependencia  estad&iacute;stica m&aacute;xima basado en informaci&oacute;n mutua. El software permite determinar  el subconjunto de atributos que posee una m&aacute;xima relevancia con el atributo  dependiente y a la vez poca redundancia entre ellos. La configuraci&oacute;n de los  par&aacute;metros para lograr estos resultados es especificando el tama&ntilde;o de  subconjunto a obtener, el criterio de selecci&oacute;n, el valor de corte de  discretizaci&oacute;n (0.0, 0.5, 1.0) y el m&eacute;todo de selecci&oacute;n para la combinaci&oacute;n de  relevancia y redundancia. Los par&aacute;metros espec&iacute;ficos para la corrida del  software fueron: 50 atributos como tama&ntilde;o del subconjunto, mRMR como criterio  de selecci&oacute;n, 0.0 como valor de corte de discretizaci&oacute;n (sin discretizaci&oacute;n) y  MIQ como m&eacute;todo de combinaci&oacute;n de relevancia y redundancia.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una  vez realizada la selecci&oacute;n de los atributos relevantes se realiza el balance de  datos con el objetivo de modificar la distribuci&oacute;n de los datos y garantizar  que los resultados de los clasificadores no sean influenciados por el  desbalance presente en los datos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En  conjuntos de entrenamientos desbalanceados la informaci&oacute;n de inter&eacute;s se encuentra  en la clase minoritaria, muchos clasificadores consideran los datos poco  representados como ruido o rarezas (Chawla<em> y cols.</em> 2002). En este  trabajo se utiliz&oacute; una t&eacute;cnica para balancear los datos que ser&aacute;n utilizados  para realizar el entrenamiento, llamada <em>Synthetic  Minority Oversampling Technique </em>(SMOTE) (Ramentol<em> y cols.</em> 2011).    <br>   SMOTE  utiliza cada instancia de la clase minoritaria e introduce instancias  sint&eacute;ticas en el segmento que une a una/todas las instancias las k instancias  m&aacute;s cercanas pertenecientes a la clase minoritaria. Dependiendo de  la cantidad de nuevas instancias requeridas, los vecinos utilizados que  pertenecen a los k vecinos m&aacute;s cercanos son seleccionados aleatoriamente. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la  aplicaci&oacute;n de este algoritmo se utiliz&oacute; la implementaci&oacute;n que est&aacute; en la  herramienta Weka (Breiman 1996). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Al finalizar  estas actividades de preprocesamiento el conjunto de datos de entrenamiento  queda reducido a un subconjunto de 50 atributos y presenta un IR=1. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una vez obtenido  el conjunto de datos de entrenamiento definitivo se procede a obtener modelos  basados en multiclasificadores. Para la obtenci&oacute;n de los modelos, en una  primera etapa, se evaluaron los ocho clasificadores mostrados en la <a href="#t01">Tabla 1</a>,  todos implementados en Weka.</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/t0111317.jpg" alt="t01" width="488" height="191"><a name="t01"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A continuaci&oacute;n,  se determin&oacute; el clasificador individual que mejor desempe&ntilde;o posee para ser  utilizado como clasificador de control en la evaluaci&oacute;n de los  multiclasificadores a utilizar en la experimentaci&oacute;n. Los multiclasificadores  utilizados fueron Baggin, Boosting, Stacking y Vote.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Baggin (Freund y Schapire 1999) y Boosting (Wolper 1992) son algoritmos que garantizan  diversidad en su aprendizaje debido a la estrategia utilizada para realizar el  entrenamiento. El m&eacute;todo de combinaci&oacute;n de las salidas generadas es la  utilizaci&oacute;n del voto mayoritario. En este trabajo se utiliz&oacute; el algoritmo  AdaboostM1 como multiclasificador Boosting.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Stacking (G. Casas) y Vote (Kuncheva 2007), a diferencia de los algoritmos  mencionados anteriormente, no garantizan la diversidad en su aprendizaje. Para  la emisi&oacute;n de un criterio sobre la clase de una instancia, estos algoritmos se  basan en las salidas emitidas por los clasificadores utilizados en la  construcci&oacute;n del modelo. En (Cabrera y Casas 2013) se especifican  los mecanismos para garantizar la diversidad en la combinaci&oacute;n de  clasificadores a utilizar en la construcci&oacute;n de un multiclasificador. Estos  mecanismos son denominados &ldquo;medidas de diversidad&rdquo;.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la  realizaci&oacute;n de este trabajo se utiliz&oacute; cinco medidas de diversidad: coeficiente  de correlaci&oacute;n (p), estad&iacute;stico Q, medida de diferencia (D), medida de doble  fallo (DF) y raz&oacute;n entre D y DF denominado como (R).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la realizaci&oacute;n de  estos c&aacute;lculos en (Cabrera y Casas 2013) plantea el  procedimiento a realizar. Primeramente, hay que determinar las posibles  combinaciones de clasificadores a utilizar.&nbsp;  La determinaci&oacute;n de las combinaciones de clasificadores m&aacute;s diversas se  realiz&oacute; mediante el c&aacute;lculo de las medidas de diversidad para el cual se  utiliz&oacute; el software &ldquo;Diversidad&rdquo; desarrollado en (Garc&iacute;a; Luengo y Herrera 2008). Esta operaci&oacute;n  permiti&oacute; determinar que un total de 32 combinaciones expresaban mayor  diversidad ante el resto de las 216.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las  combinaciones diversas se organizaron de forma tal que permitiera realizar una  experimentaci&oacute;n con aquellas combinaciones que eran diversidad en las cinco  medidas calculadas y otra experimentaci&oacute;n con aquellas combinaciones que eran  diversas en cuatro de las cinco medidas utilizadas. El algoritmo Stacking  utiliza como m&eacute;todo de combinaci&oacute;n de las salidas de los clasificadores un  clasificador, llamado metaclasificador, que entrena con un conjunto de  instancias que se generan, donde cada componente de una instancia es la salida  que emite cada clasificador individual utilizado en la construcci&oacute;n del modelo  y el atributo dependiente de esta instancia es la clase real. En este caso se  utiliz&oacute; como metaclasificador el clasificador individual que mejor desempe&ntilde;o  tuvo en la evaluaci&oacute;n individual que se realiz&oacute;.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo  Vote propone cinco m&eacute;todos de combinaci&oacute;n de las salidas de los clasificadores  individuales, tales como: voto mayoritario, promedio de probabilidades, m&aacute;ximo  de probabilidades, menor probabilidad y mediana de probabilidades. En este caso  se utilizar&aacute;n los m&eacute;todos: voto mayoritario y promedio de probabilidades. Por  tal raz&oacute;n la experimentaci&oacute;n deber&aacute; ser realizada sobre cada uno de los dos  grupos de combinaciones de clasificadores construidas anteriormente utilizando  para ellos los m&eacute;todos de combinaci&oacute;n anteriormente establecidos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Finalmente se  evaluaron los modelos obtenidos y se determinaron aquellos modelos que  superaron en desempe&ntilde;o del mejor clasificador individual demostrando que se  obtuvo una mejora en el desempe&ntilde;o respecto a los desempe&ntilde;os obtenidos con los  clasificadores por separado.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la  evaluaci&oacute;n del desempe&ntilde;o de un clasificador se deben tener en cuenta la  existencia de m&eacute;tricas que permiten evaluar cuan bien se comporta un modelo  frente a una situaci&oacute;n desconocida, es decir, permite evaluar la capacidad  generalizadora de esos modelos. Existen varias m&eacute;tricas tales como desempe&ntilde;o.  En este trabajo se utiliz&oacute; el ACC, AUC y el estad&iacute;stico Kappa, para evaluar el  desempe&ntilde;o de los multiclasificadores respecto al clasificador de control.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Luego de aplicar  el procedimiento propuesto por Tropsha y colaboradores se eliminaron los  compuestos que pose&iacute;an elementos met&aacute;licos, organomet&aacute;licos y poco  representados. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se utiliz&oacute; ISIDA  como herramienta para la determinaci&oacute;n de los descriptores moleculares de las  mol&eacute;culas a partir de las cuales se procedi&oacute; a realizar la experimentaci&oacute;n. Se  obtuvieron un total de 693 atributos por cada instancia del conjunto de datos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A continuaci&oacute;n,  se utiliz&oacute; el <em>ChemAxon&acute;s Standarizer </em>para realizar la estandarizaci&oacute;n de  las mol&eacute;culas y as&iacute; evitar mol&eacute;culas con un mismo grupo funcional, pero  representadas con patrones estructurales diferentes y dar paso a la  identificaci&oacute;n de mol&eacute;culas duplicadas. Para la identificaci&oacute;n y posterior  eliminaci&oacute;n de duplicados se utiliz&oacute; el m&oacute;dulo ChemAxon&acute;s EdiSDF. En este caso  no se encontraron duplicados en el conjunto de datos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tropsha propone  adem&aacute;s que para la realizaci&oacute;n de estudios QSAR utilizando miner&iacute;a de datos el  conjunto de datos debe ser particionado de forma que el 75% de las instancias  pertenecientes a ambas clases sean utilizadas para realizar el entrenamiento de  los clasificadores y el estante 25% de ellas sea utilizado como m&eacute;todo de validaci&oacute;n  del aprendizaje inducido por los clasificadores. Luego de realizada esta  operaci&oacute;n se obtuvieron los conjuntos de datos a utilizar. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Selecci&oacute;n de atributos, balanceo  de datos y modelaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para llevar a  cabo la selecci&oacute;n de atributos se utiliz&oacute; el software mRMR, que permiti&oacute; la  obtenci&oacute;n de un subconjunto de 50 atributos relevantes y poco redundantes entre  ellos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A continuaci&oacute;n,  se procedi&oacute; a realizar el balance de los datos. Mediante el algoritmo SMOTE, el  cual permiti&oacute; la creaci&oacute;n de 143 instancias artificiales que garantiz&oacute; un IR=1  en el conjunto de datos a utilizar para la obtenci&oacute;n de los modelos. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una vez  balanceados los datos se realiz&oacute; una evaluaci&oacute;n con ocho clasificadores  individuales, tal como se muestra en la <a href="#t01">Tabla 1</a>. En la evaluaci&oacute;n de cada  clasificador individual se puede apreciar el clasificador <em>ET </em>con mejor  desempe&ntilde;o (teniendo en cuenta las medidas ACC, AUC y KAPPA) y por lo tanto ser&aacute; utilizado para la evaluaci&oacute;n  de los modelos multiclasificadores determinados en el proceso que sigue a continuaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se prosigui&oacute; con  la evaluaci&oacute;n de los multiclasificadores Baggin y Boosting. Los resultados se  pueden consultar en la <a href="#t02">Tabla 2</a>. Luego de un an&aacute;lisis se determin&oacute; un modelo  Boosting basado en una red neuronal (<em>MLP</em>) que supera al mejor clasificador  individual evaluado.</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/t0211317.jpg" alt="t02" width="470" height="199"><a name="t02"></a></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Otros dos  multiclasificadores fueron evaluados, tal como se especific&oacute; anteriormente.  Estos multiclasificadores a diferencia de los anteriores no garantizan la  diversidad en su aprendizaje por lo que es necesario que el usuario garantice  la diversidad en la combinaci&oacute;n de clasificadores que son utilizados en la  obtenci&oacute;n del modelo.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se procedi&oacute; a determinar las combinaciones posibles a  obtener con los ocho clasificadores lo cual arroj&oacute; 248 combinaciones posibles a  evaluar. Las medidas de diversidad fueron calculadas y solo se seleccionaron  aquellas combinaciones de clasificadores que eran diversas en las cinco medidas  de diversidad elegidas para este trabajo y otras combinaciones que fueron  diversas en cuatro de las cinco medidas de diversidad calculadas. Esta  informaci&oacute;n puede ser consultada en la <a href="#t03">Tabla 3</a> y la <a href="#t04">Tabla 4</a>. </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/t0311317.jpg" alt="t03" width="443" height="372"><a name="t03"></a></p>     <p align="center">&nbsp;</p>     <p align="center"><img src="/img/revistas/rcci/v11n3/t0411317.jpg" alt="t04" width="483" height="248"><a name="t04"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una  vez determinadas las combinaciones de clasificadores m&aacute;s diversas se procedi&oacute; a  realizar la experimentaci&oacute;n utilizando el <em>Stacking</em> con las dos agrupaciones de combinaciones de clasificadores. Los resultados obtenidos  en la experimentaci&oacute;n fueron recogidos en las <a href="/img/revistas/rcci/v11n3/t0511317.jpg" target="_blank">Tabla 5</a> y <a href="/img/revistas/rcci/v11n3/t0611317.jpg" target="_blank">Tabla 6</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como  se puede apreciar en la <a href="/img/revistas/rcci/v11n3/t0511317.jpg" target="_blank">Tabla 5</a> ninguna de las combinaciones posee un desempe&ntilde;o  superior al mejor clasificador individual por tal raz&oacute;n no ser&aacute;n tenidas en  cuenta para la selecci&oacute;n del mejor multiclasificador.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este caso el mejor  resultado iguala al desempe&ntilde;o del mejor clasificador individual. En la <a href="/img/revistas/rcci/v11n3/t0611317.jpg" target="_blank">Tabla 6</a> se encontr&oacute; una combinaci&oacute;n que supera en desempe&ntilde;o al mejor clasificador  individual, por lo que estamos en presencia del segundo modelo a utilizar como  soluci&oacute;n al problema.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Luego  de realizar un an&aacute;lisis se pudo determinar qu&eacute; los resultados previos  demuestran que la forma de determinar diversidad reportada en la literatura no  est&aacute; correlacionada con una mejora en el desempe&ntilde;o del multiclasificador  utilizado. En este caso se identific&oacute; una combinaci&oacute;n de clasificadores que  seg&uacute;n las medidas de diversidad no era muy diversa y sin embargo garantiz&oacute;, con  su utilizaci&oacute;n, una mejora en el desempe&ntilde;o del multiclasificador utilizado permitiendo  obtener un desempe&ntilde;o superior al desempe&ntilde;o del mejor clasificador individual  utilizado para la evaluaci&oacute;n de los multiclasificadores.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se procedi&oacute; a realizar la  experimentaci&oacute;n ahora con el algoritmo Vote para la construcci&oacute;n del modelo. A continuaci&oacute;n,  se muestran los resultados de la experimentaci&oacute;n con el multiclasificador Vote  para los dos grupos de clasificadores diversos registrados en las <a href="/img/revistas/rcci/v11n3/t0711317.jpg" target="_blank">Tabla 7</a> y <a href="/img/revistas/rcci/v11n3/t0811317.jpg" target="_blank">Tabla 8</a>.  Donde se utilizan los dos m&eacute;todos de combinaci&oacute;n de clasificadores propuestos  anteriormente. </font></p>     ]]></body>
<body><![CDATA[<p>C<font size="2" face="Verdana, Arial, Helvetica, sans-serif">omo  resultado del an&aacute;lisis de la informaci&oacute;n registrada en las <a href="/img/revistas/rcci/v11n3/t0811317.jpg" target="_blank">Tabla 8</a> y <a href="#t09">Tabla 9</a> no se  identific&oacute; ninguna combinaci&oacute;n que superar al desempe&ntilde;o del mejor clasificador  individual, por tal raz&oacute;n no ser&aacute;n tenidas en cuenta para la selecci&oacute;n del mejor  multiclasificador</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Selecci&oacute;n de los modelos para la soluci&oacute;n del problema.</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A  partir de an&aacute;lisis de los resultados de los multiclasificadores se  identificaron dos multiclasificadores que mostraron un desempe&ntilde;o superior al  mejor desempe&ntilde;o logrado por los clasificadores individuales. Los resultados se  compilan en la <a href="#t09">Tabla 9</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A  partir de an&aacute;lisis realizado con los dos multiclasificadores candidatos se pudo  determinar que ambos multiclasificadores no presentan diferencias  significativas en su desempe&ntilde;o ya que poseen el mismo valor de la efectividad y  una diferencia no significativa en los par&aacute;metros referentes al &aacute;rea bajo la  curva ROC y el estad&iacute;stico Kappa.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Por tal raz&oacute;n ambos  multiclasificadores constituyen las propuestas a utilizar para la clasificaci&oacute;n  de los LI (seguros o t&oacute;xicos) ante la posible inhibici&oacute;n del funcionamiento de  la enzima AChE.</font> </p>     <p align="center"><img src="/img/revistas/rcci/v11n3/t0911317.jpg" alt="t09" width="492" height="198"><a name="t09"></a></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con  la realizaci&oacute;n se de este trabajo se obtuvo un conjunto de datos referente a  los l&iacute;quidos i&oacute;nicos y su efecto sobre la enzima AChE. Se aplic&oacute;, como parte  del preprocesamiento a realizar sobre los datos, la limpieza manual propuesta  por Tropsha a partir de la cual se eliminaron 28 mol&eacute;culas. A continuaci&oacute;n, se  procedi&oacute; a calcular los descriptores moleculares, se estandarizaron y se  procedi&oacute; a la identificaci&oacute;n de duplicados en el conjunto de datos. Este &uacute;ltimo  paso permiti&oacute; determinar que no exist&iacute;an mol&eacute;culas duplicadas en los datos. A continuaci&oacute;n,  se seleccion&oacute; el 75% de cada instancia para generar el conjunto de datos  entrenamiento y el restante 25% fue utilizado para evaluar el aprendizaje. El  software utilizado para el c&aacute;lculo de los descriptores moleculares determin&oacute;  693 atributos por cada una de las instancias. A partir de esta situaci&oacute;n se procedi&oacute;  a reducir la dimensionalidad del conjunto de datos, para ello se utiliz&oacute; el  software mRMR que permiti&oacute; la obtenci&oacute;n de un subconjunto de 50 atributos. A continuaci&oacute;n,  se aplic&oacute; el algoritmo SMOTE para modificar la distribuci&oacute;n de los datos y de  esta forma balancear la ocurrencia de ambas clases. Se procedi&oacute; con la  evaluaci&oacute;n de ocho clasificadores que fueron utilizados como bases de los  multiclasificadores a utilizar en la obtenci&oacute;n del modelo que prediga si un LI  es toxico o seguro ante la AChE. Luego de evaluados los clasificadores  individuales, se procedi&oacute; a evaluar los modelos obtenidos con los  multiclasificadores Baggin y Boosting y al compararlos con los clasificadores  individuales, se determin&oacute; que el algoritmo AdaboostM1, perteneciente a la categor&iacute;a  de multiclasificador Boosting, super&oacute; el desempe&ntilde;o del mejor clasificador  individual utilizando como clasificador base una red neuronal MLP. Se procedi&oacute;  a evaluar los multiclasificadores Stacking y Vote, a diferencia de Baggin y  Boosting estos algoritmos no tienen en cuenta la diversidad de los  clasificadores individuales a utilizar en la construcci&oacute;n del modelo, por tal  raz&oacute;n el usuario debe determinar las combinaciones de clasificadores diversas.  Para ello se calcularon cinco medidas de diversidad reportadas en la literatura  por cada combinaci&oacute;n de clasificadores y luego de seleccionar las combinaciones  m&aacute;s diversas se determin&oacute; otro modelo que super&oacute; al mejor clasificador  individual, modelo conformado por el multiclasificador Stacking y utilizando  como clasificadores de base la combinaci&oacute;n AD, J, K, NB y SMO. Por &uacute;ltimo, se compararon los dos modelos encontrados y se determin&oacute; que  entre ellos no existen diferencias significativas por lo que se proponen ambos  modelos para predecir si un l&iacute;quido i&oacute;nico desconocido si ser&aacute; capaz de inhibir  la enzima AChE y por lo tanto provocar los efectos negativos mencionados en el  organismo afectado. Logr&aacute;ndose darle cumplimiento al objetivo propuesto en el  trabajo.</font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS  BIBLIOGR&Aacute;FICAS</B></font>     <!-- ref --><p><font size="2"><a><font face="Verdana, Arial, Helvetica, sans-serif">ARNING,  S. S. J.<em> y cols.</em> <em>Qualitative and quantitative structure activity relationships for the  inhibitory effects of cationic head groups, functionalised side chains and  anions of ionic liquids on acetylcholinesterase</em>, Green Chem, 2008. 10.    </font></a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>ARNING,  S. S. J. y A. BOSHEN. <em>Qualitative and  quantitative structure activity relationship for the inhibitory effects of  cationic head groups, functionalised side chains and anions of ionic liquids on  acetylcholinesterase</em>, Green Chemistry, 2008. 10.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>BREIMAN,  L. <em>Bagging predictors</em>, Machine  Learning, 1996. 24.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>CABRERA,  L. y G. CASAS. <em>Estudios de medidas de  diversidad en sistemas multiclasificadores.</em> Universidad de Las Villas.  Martha Abreu, Laboratorio de Bioinform&aacute;tica, 2013.    </a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>COULING,  D. J.<em> y cols. Assessing the factors  responsible for ionic liquid toxicity to aquatic organisms via quantitative  structure&ndash;property relationship modeling</em>, Green Chem, 2006. 8.</a> </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>CHAWLA,  N.<em> y cols.</em> <em>Smote: Synthetic minority over-sampling technique</em>, Artificial  intelligence research, 2002. 16.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>CHEMAXON.<em> &quot;Chemaxon&quot;</em>, 2012.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>CHEMAXON. <em>&quot;Standarizer,&quot;</em> 2012.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>FRADE,  C. A. A. R. F. y H. EXP., Toxicol, 2010. p.     </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>FREUND,  Y. y R. SCHAPIRE. <em>A short introduction to  boosting</em>, Journal of Japanese Society for Artificial Intelligence, 1999.    </a> </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>G.  CASAS, J. L. M., L. DENODA, L. CABRERA, L. ARGUELLES, AND E. GONZALEZ,  &quot;High cardiovascular risk models for a city in the central region of  cuba.    &quot;.</a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>GARC&Iacute;A-LORENZO,  E. T. A.<em> y cols.</em> <em>Cytotoxicity of selected imidazolium-derived ionic liquids in the human  caco-2 cell line. Sub-structural toxicological interpretation through a qsar  study</em>, Green Chem, 2008. 10.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>GARC&Iacute;A,  A. F. S.; L. LUENGO y F. HERRERA. <em>A study  of statistical techniques and performance measures for genetics-based machine  learning: Accuracy and interpretability</em>, Soft Comput, 2008. 13.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>HOSSAIN,  B. B. S. M. I.<em> y cols.</em> <em>Development of a novel mathematical model  using a group contribution method for prediction of ionic liquid toxicities</em>,  Chemosphere, 2011. 85.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>ISIDA  &quot;Isida&quot;, 2008.    </a> </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>IZADIYAN,  M. H. F. P. <em>In silico cytotoxicity  estimation of ionic liquids based on their twoand three-dimensional structural  descriptors</em>, Monatsh Chem, 2011. 142.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>J.  KOOLMAN, A. K. H. R. <em>Color atlas of  biochemistry</em>, Estados Unidos: Thieme, 2005.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>J. P.  J. S. TORRECILLA, J. L. A. F. R.<em> &#8213;a  quantum-chemical-based guide to analyze/quantify the cytotoxicity of ionic  liquids</em>. &#8214; Green Chem, 2010. p.     </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>KUNCHEVA,  L. I.<em> Combining pattern classifiers:  Methods and algorithms (kuncheva, l.I.; 2004) [book review]</em>, Neural  Networks IEEE Transactions on, 2007. 18.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>LACRAMA,  M. V. P. A. V. O. A.-M.<em> A spectralsar  model for the anionic-cationic interaction in ionic liquids: Application to  vibri o fischeri ecotoxicity</em>, Int. J. Mol. Sci, 2007. 8.    </a> </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>LUIS,  A. G. P. y A. IRABIEN. <em>Quantitative  structure &ndash; activity relationships (qsars) to estimate ionic liquids  ecotoxicity ec50 (vibrio fi scheri )</em>, Molecular Liquids, 2010. 152.</a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>LUIS,  I. O. P.; R. ALDACO y A. IRABIEN. <em>A novel  group contribution method in the development of a qsar for predicting the  toxicity (vibrio fischeri ec50) of ionic liquids</em>, Ecotoxicol. Environ. Saf,  2007. 67.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>MATHEWS.,  H., AND AHERN. <em>Biochemistry</em>, 2005.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>METZLER,  D. E. <em>Biochemistry. The chemical  reactions of living cells</em>, ELSEVIER. Academic Press, 2003.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>MOHAMMAD,  P. I. y H. FATEMI. <em>Cytotoxicity estimation  of ionic liquids based on their effective structural features</em>, Chemosphere,  2011. 84.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>PENG,  H.; F. LONG y C. DING.<em> Feature selection  based on mutual information: Criteria of max-dependency, max-relevance and  minredundancy</em>, IEEE Transacti on in pattern recognizicion and machine  intelligent, 2005.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>PUTZ,  A.-M. L. M. A. V. O. M. V. <em>Res. Lett</em>.  Ecology, 2007. p.     </a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>RAMENTOL,  E.<em> y cols.</em> <em>Smote-rs b</em></a><em>&lowast;: A hybrid preprocessing  approach based on oversampling and undersampling for high </em>    <br>     <em>imbalanced data-sets using  smote and rough sets theory</em>, Knowl Inf Syst, 2011. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>SIERRA,  A. G. J.; E. MART&Iacute; y R. CRUA&Ntilde;AS. <em>Qu&iacute;mica  verde: Toxicidad y biodegradabilidad de l&iacute;quidos i&oacute;nicos</em>. Universitat de  Barcelona, Departament de Productes Naturals, Biologia Vegetal i Edafologia,  Unitat d&rsquo;Edafologia, 2006.</a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>STOCK,  F.<em> y cols.</em> <em>Effects of ionic liquids on the acetylcholinesterase -a  structure-activity relationship consideration</em>, Green Chem, 2004. 6.    </a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>ST&Ouml;RMANN,  J. A. R.<em> y cols.</em> <em>Uft merck ionic liquids biological effects database</em>, 2014.  [Disponible en: </a><a href="http://www.ileco.uft.uni-bremen.de">http://www.ileco.uft.uni-bremen.de</a>. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>TORRECILLA,  J. S.<em> y cols.</em> <em>A quantum-chemical-based guide to analyze/quantify the cytotoxicity of  ionic liquids</em>, Green Chemistry, 2010. 12.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>TROPSHA,  D. F. A. y E. MURATOV. <em>Trust, but verify:  On importance of chemical structure curation in chemiinformatic and qsar  modeling research</em>, J. Chem. Inf. Model, 2010.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>V.  SOLOV&acute;EP, A. A. V., . &quot;Editor of the structure data file,&quot; 2010.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>WOLPER,  D. H. <em>Stacked generalization</em>, Neural  Networks, 1992. vol. 5.    </a> </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a>ZHAO,  Y. L. D. y Z. ZHANG. <em>Toxicity of ionic  liquids</em>, Clean Prod. Proces., 2007. 35.    </a></font></p>     <p name="_ENREF_1">&nbsp;</p>     ]]></body>
<body><![CDATA[<p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 20/05/2017    <br> Aceptado: 25/06/2017</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ARNING]]></surname>
<given-names><![CDATA[S. S. J]]></given-names>
</name>
</person-group>
<source><![CDATA[Qualitative and quantitative structure activity relationships for the inhibitory effects of cationic head groups, functionalised side chains and anions of ionic liquids on acetylcholinesterase]]></source>
<year>2008</year>
<page-range>10</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ARNING]]></surname>
<given-names><![CDATA[S. S. J]]></given-names>
</name>
<name>
<surname><![CDATA[BOSHEN]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Qualitative and quantitative structure activity relationship for the inhibitory effects of cationic head groups, functionalised side chains and anions of ionic liquids on acetylcholinesterase]]></source>
<year>2008</year>
<page-range>10</page-range><publisher-name><![CDATA[Green Chemistry]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BREIMAN]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[Bagging predictors]]></source>
<year>1996</year>
<page-range>24</page-range><publisher-name><![CDATA[Machine Learning]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CABRERA]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[CASAS]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[Estudios de medidas de diversidad en sistemas multiclasificadores]]></source>
<year>2013</year>
<publisher-name><![CDATA[Universidad de Las Villas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[COULING]]></surname>
<given-names><![CDATA[D. J]]></given-names>
</name>
</person-group>
<source><![CDATA[Assessing the factors responsible for ionic liquid toxicity to aquatic organisms via quantitative structure-property relationship modeling]]></source>
<year>2006</year>
<page-range>8</page-range><publisher-name><![CDATA[Green Chem]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHAWLA]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[Smote: Synthetic minority over-sampling technique]]></source>
<year>2002</year>
<page-range>16</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHEMAXON]]></surname>
</name>
</person-group>
<source><![CDATA[Chemaxon]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHEMAXON]]></surname>
</name>
</person-group>
<source><![CDATA[Standarizer]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FRADE]]></surname>
<given-names><![CDATA[C. A]]></given-names>
</name>
<name>
<surname><![CDATA[EXP]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Toxicol]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FREUND]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[SCHAPIRE]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[A short introduction to boosting]]></source>
<year>1999</year>
<publisher-name><![CDATA[Journal of Japanese Society for Artificial Intelligence]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[G. CASAS]]></surname>
<given-names><![CDATA[J. L. M]]></given-names>
</name>
<name>
<surname><![CDATA[DENODA]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[CABRERA]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[ARGUELLES]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[GONZALEZ]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[High cardiovascular risk models for a city in the central region of cuba]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GARCÍA-LORENZO]]></surname>
<given-names><![CDATA[E. T. A]]></given-names>
</name>
</person-group>
<source><![CDATA[Cytotoxicity of selected imidazolium-derived ionic liquids in the human caco-2 cell line.]]></source>
<year>2008</year>
<page-range>10</page-range><publisher-name><![CDATA[Green Chem]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GARCÍA]]></surname>
<given-names><![CDATA[A. F. S]]></given-names>
</name>
<name>
<surname><![CDATA[LUENGO]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[HERRERA]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<source><![CDATA[A study of statistical techniques and performance measures for genetics-based machine learning: Accuracy and interpretability]]></source>
<year>2008</year>
<page-range>13</page-range><publisher-name><![CDATA[Soft Comput]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HOSSAIN]]></surname>
<given-names><![CDATA[B. B]]></given-names>
</name>
</person-group>
<source><![CDATA[Development of a novel mathematical model using a group contribution method for prediction of ionic liquid toxicities]]></source>
<year>2011</year>
<page-range>85</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<collab>ISIDA</collab>
<source><![CDATA[Isida]]></source>
<year>2008</year>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[IZADIYAN]]></surname>
<given-names><![CDATA[M. H. F. P]]></given-names>
</name>
</person-group>
<source><![CDATA[In silico cytotoxicity estimation of ionic liquids based on their twoand three-dimensional structural descriptors,]]></source>
<year>2011</year>
<publisher-name><![CDATA[Monatsh Chem]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KOOLMAN]]></surname>
<given-names><![CDATA[A. K. H. R]]></given-names>
</name>
</person-group>
<source><![CDATA[Color atlas of biochemistry]]></source>
<year>2005</year>
<publisher-name><![CDATA[Thieme]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[P. J. S. TORRECILLA]]></surname>
<given-names><![CDATA[J. L. A. F. R]]></given-names>
</name>
</person-group>
<source><![CDATA[a quantum-chemical-based guide to analyze/quantify the cytotoxicity of ionic liquids.]]></source>
<year>2010</year>
<publisher-name><![CDATA[Green Chem]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KUNCHEVA]]></surname>
<given-names><![CDATA[L. I]]></given-names>
</name>
</person-group>
<source><![CDATA[Combining pattern classifiers: Methods and algorithms]]></source>
<year>2007</year>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LACRAMA]]></surname>
<given-names><![CDATA[M. V]]></given-names>
</name>
</person-group>
<source><![CDATA[A spectralsar model for the anionic-cationic interaction in ionic liquids:: Application to vibri o fischeri ecotoxicity]]></source>
<year>2007</year>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LUIS]]></surname>
<given-names><![CDATA[A. G. P]]></given-names>
</name>
<name>
<surname><![CDATA[IRABIEN]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Quantitative structure - activity relationships (qsars) to estimate ionic liquids ecotoxicity ec50 (vibrio fi scheri ),]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LUIS]]></surname>
<given-names><![CDATA[I. O. P]]></given-names>
</name>
<name>
<surname><![CDATA[ALDACO]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[IRABIEN]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[A novel group contribution method in the development of a qsar for predicting the toxicity (vibrio fischeri ec50) of ionic liquids,]]></source>
<year>2007</year>
</nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MATHEWS]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[AHERN]]></surname>
</name>
</person-group>
<source><![CDATA[Biochemistry]]></source>
<year>2005</year>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[METZLER]]></surname>
<given-names><![CDATA[D. E]]></given-names>
</name>
</person-group>
<source><![CDATA[Biochemistry]]></source>
<year>2003</year>
<publisher-name><![CDATA[Academic Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MOHAMMAD]]></surname>
<given-names><![CDATA[P. I]]></given-names>
</name>
<name>
<surname><![CDATA[FATEMI]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Cytotoxicity estimation of ionic liquids based on their effective structural features]]></source>
<year>2011</year>
<page-range>84</page-range><publisher-name><![CDATA[Chemosphere]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[PENG]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[LONG]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[DING]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[Feature selection based on mutual information: Criteria of max-dependency, max-relevance and minredundancy]]></source>
<year>2005</year>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[PUTZ]]></surname>
<given-names><![CDATA[A.-M]]></given-names>
</name>
</person-group>
<source><![CDATA[Ecology]]></source>
<year>2007</year>
</nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RAMENTOL]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Smote-rs b&#8727;:: A hybrid preprocessing approach based on oversampling and undersampling for high imbalanced data-sets using smote and rough sets theory]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SIERRA]]></surname>
<given-names><![CDATA[A. G. J]]></given-names>
</name>
<name>
<surname><![CDATA[MARTÍ]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[CRUAÑAS]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Química verde: Toxicidad y biodegradabilidad de líquidos iónicos]]></source>
<year>2006</year>
<publisher-name><![CDATA[Universitat de Barcelona]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[STOCK]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<source><![CDATA[Effects of ionic liquids on the acetylcholinesterase -a structure-activity relationship consideration,]]></source>
<year>2004</year>
</nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[STÖRMANN]]></surname>
<given-names><![CDATA[J. A. R]]></given-names>
</name>
</person-group>
<source><![CDATA[Uft merck ionic liquids biological effects database]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TORRECILLA]]></surname>
<given-names><![CDATA[J. S]]></given-names>
</name>
</person-group>
<source><![CDATA[A quantum-chemical-based guide to analyze/quantify the cytotoxicity of ionic liquids, Green Chemistry,]]></source>
<year>2010</year>
<page-range>12</page-range></nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TROPSHA]]></surname>
<given-names><![CDATA[D. F. A]]></given-names>
</name>
<name>
<surname><![CDATA[MURATOV]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Trust, but verify: On importance of chemical structure curation in chemiinformatic and qsar modeling research]]></source>
<year>2010</year>
<publisher-name><![CDATA[. Chem. Inf. Model]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[V. SOLOV´EP]]></surname>
<given-names><![CDATA[A. A. V]]></given-names>
</name>
</person-group>
<source><![CDATA["Editor of the structure data file,"]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WOLPER]]></surname>
<given-names><![CDATA[D. H]]></given-names>
</name>
</person-group>
<source><![CDATA[Stacked generalization,]]></source>
<year>1992</year>
<volume>vol. 5</volume>
</nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ZHAO]]></surname>
<given-names><![CDATA[Y. L. D]]></given-names>
</name>
<name>
<surname><![CDATA[ZHANG]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
</person-group>
<source><![CDATA[Toxicity of ionic liquids]]></source>
<year>2007</year>
<page-range>35</page-range><publisher-name><![CDATA[Clean Prod. Proces]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
