<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992016000200006</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Selección de rasgos en muestras citológicas usando información heurística]]></article-title>
<article-title xml:lang="en"><![CDATA[Feature selection on pap-smear data using heuristic information]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rojas Delgado]]></surname>
<given-names><![CDATA[Jairo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas  ]]></institution>
<addr-line><![CDATA[ La Habana]]></addr-line>
<country>CUBA</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>06</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>06</month>
<year>2016</year>
</pub-date>
<volume>10</volume>
<numero>2</numero>
<fpage>73</fpage>
<lpage>88</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992016000200006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992016000200006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992016000200006&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En este trabajo se investiga un método de selección de rasgos que permita clasificar las muestras celulares tomadas del cuello del útero en cancerosas o no. El cáncer en el cuello del útero es el segundo tipo de cáncer más difundido entre las mujeres y la investigación de métodos informáticos en función de la correcta clasificación de muestras tiene un impacto directo en la calidad de vida de los pacientes. Se investiga un conjunto de rasgos seleccionado teniendo en cuenta su importancia y la capacidad de un grupo de clasificadores de prueba para apreciar dichos rasgos. Los clasificadores de prueba empleados son: HCM, FCM, LS y WKNN. Los resultados demuestran que la utilización de dicho conjunto de rasgos arroja por lo general buenos resultados de clasificación.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This paper presents a method of feature selection to classify cell samples taken from the cervix into cancerous or not cancerous cells. Cancer of the cervix is the second most widespread cancer in women and the investigation of computational methods based on the correct classification of samples has a direct impact on the life's quality of patients. A set of selected features is investigated taking into account the importance of these features and the ability of a test group of classifiers to assess those traits. The test classifiers used are: HCM, FCM, LS and WKNN. The results demonstrate that the use of that set of features generally yields good classification results.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[clasificador]]></kwd>
<kwd lng="es"><![CDATA[selección de rasgos]]></kwd>
<kwd lng="es"><![CDATA[muestra citológica]]></kwd>
<kwd lng="es"><![CDATA[potencial discriminador]]></kwd>
<kwd lng="en"><![CDATA[classification]]></kwd>
<kwd lng="en"><![CDATA[discriminator potential]]></kwd>
<kwd lng="en"><![CDATA[feature selection]]></kwd>
<kwd lng="en"><![CDATA[pap-smear]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Selecci&oacute;n  de rasgos en muestras citol&oacute;gicas usando informaci&oacute;n heur&iacute;stica</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Feature selection on pap-smear  data using heuristic information</font></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Jairo Rojas Delgado<strong><sup>1*</sup></strong></font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Universidad de las Ciencias Inform&aacute;ticas. Carretera a San Antonio de los  Ba&ntilde;os km 2 &frac12;. Reparto Torrens. Boyeros. La Habana. C.P.: 19370. CUBA</font></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:jrdelgado@uci.cu">jrdelgado@uci.cu</a><a href="mailto:mcairo@uci.cu"></a><a href="mailto:jova@uci.cu"></a></font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:losorio@ismm.edu.cu"></a> </font>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este trabajo se investiga un m&eacute;todo de selecci&oacute;n de rasgos que  permita clasificar las muestras celulares tomadas del cuello del &uacute;tero en  cancerosas o no. El c&aacute;ncer en el cuello del &uacute;tero es el segundo tipo de c&aacute;ncer  m&aacute;s difundido entre las mujeres y la investigaci&oacute;n de m&eacute;todos inform&aacute;ticos en  funci&oacute;n de la correcta clasificaci&oacute;n de muestras tiene un impacto directo en la  calidad de vida de los pacientes. Se investiga un conjunto de rasgos  seleccionado teniendo en cuenta su importancia y la capacidad de un grupo de  clasificadores de prueba para apreciar dichos rasgos. Los clasificadores de  prueba empleados son: HCM, FCM, LS y WKNN. Los resultados demuestran que la  utilizaci&oacute;n de dicho conjunto de rasgos arroja por lo general buenos resultados  de clasificaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">clasificador, selecci&oacute;n de rasgos, muestra citol&oacute;gica, potencial  discriminador</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">This paper presents a method  of feature selection to classify cell samples taken from the cervix into  cancerous or not cancerous cells. Cancer of the cervix is the second most  widespread cancer in women and the investigation of computational methods based  on the correct classification of samples has a direct impact on the life's  quality of patients. A set of selected features is investigated taking into  account the importance of these features and the ability of a test group of  classifiers to assess those traits. The test classifiers used are: HCM, FCM, LS  and WKNN. The results demonstrate that the use of that set of features  generally yields good classification results.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>classification, discriminator  potential, feature selection, pap-smear</font></p> <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El c&aacute;ncer en  el cuello del &uacute;tero es el segundo tipo de c&aacute;ncer m&aacute;s difundido entre las  mujeres con m&aacute;s de 500 mil casos cada a&ntilde;o (Paavonen, 2007). Mediante el m&eacute;todo  de Papanicolaou, es posible obtener muestras celulares del cuello del &uacute;tero que  son procesadas por cito-t&eacute;cnicos en un laboratorio para el diagn&oacute;stico de  c&aacute;ncer. Esto es posible mediante el uso de un microscopio, con el cual los  expertos pueden observar visualmente cambios precancerosos y condiciones  anormales en la estructura de las c&eacute;lulas antes de que progresen a formas m&aacute;s  avanzadas de la enfermedad (Meisels and Morin, 1997).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La prueba de  Papanicolaou se ha convertido en el m&eacute;todo m&aacute;s empleado para la detecci&oacute;n de  c&aacute;ncer en el cuello del &uacute;tero en etapas tempranas (Chang et al., 2009). Debido  a esto, en los &uacute;ltimos a&ntilde;os se ha incrementado la necesidad de contar con  expertos bien entrenados en el &aacute;rea para aumentar la capacidad de procesamiento  de los laboratorios.&nbsp; De hecho, la  aplicaci&oacute;n masiva de esta prueba ha disminuido significativamente la incidencia  de la mortalidad del c&aacute;ncer invasivo en los pa&iacute;ses desarrollados (Plissiti and  Nikou, 2012). Seg&uacute;n (Chen et al., 2014) la incidencia de la mortalidad del  c&aacute;ncer del cuello del &uacute;tero decreci&oacute; un 47.8 por ciento luego de la aplicaci&oacute;n  masiva de esta prueba en Taiw&aacute;n de 1995 hasta el 2006.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Diferenciar  correctamente los tipos de c&eacute;lulas obtenidas mediante el m&eacute;todo de Papanicolaou  es un trabajo dif&iacute;cil y lento incluso para los cito-t&eacute;cnicos mejor entrenados.  Por esto, los expertos emplean un procedimiento est&aacute;ndar referido como The  Basheda System (TBS) (Solomon et al., 2002). A pesar de que muchas de las  reglas y criterios definidos por TBS se encuentran claramente descritos, la  evaluaci&oacute;n de estas reglas y criterios var&iacute;a subjetivamente de experto en  experto (Bak et al., 2004). Esta peculiaridad contribuye a la aparici&oacute;n de  diagn&oacute;sticos incorrectos con graves implicaciones para los pacientes y para los  hospitales que deben invertir recursos extras en la correcci&oacute;n de estos  diagn&oacute;sticos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con el  objetivo de disminuir las tasas de diagn&oacute;sticos incorrectos se ha introducido  un grupo de tecnolog&iacute;as novedosas que involucran a los procesos de preparaci&oacute;n  de la muestra, control de calidad de los preparados, etc. Entre los  dispositivos comerciales que actualmente se encuentran disponibles puede  mencionarse la mejora de los portaobjetos para disminuir los errores en las  muestras (Dawson, 2004; Kardos, 2004) y la mejora del control de la calidad en  los laboratorios mediante la repetici&oacute;n de los preparados (Mango, 1996). Sin  embargo, la mayor&iacute;a de estos dispositivos son incapaces de asistir a un  diagn&oacute;stico objetivo puesto que no ofrecen variables cuantitativas para  eliminar la evaluaci&oacute;n subjetiva del cito-t&eacute;cnico: errores de interpretaci&oacute;n y  discrepancias inter-observador (Chen et al., 2014).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En los &uacute;ltimos  20 a&ntilde;os se han llevado a cabo un grupo de investigaciones relacionadas con esta  tem&aacute;tica, especialmente en la Universidad de Aegan en cooperaci&oacute;n con el  Hospital Universitario de Herlev ubicado en Grecia. La presente investigaci&oacute;n  est&aacute; construida sobre los resultados de dichos proyectos investigativos.  Durante las investigaciones llevadas a cabo en el Hospital Universitario de  Herlev se han construido dos versiones de una base de datos con prop&oacute;sitos de  clasificaci&oacute;n. La primera de ellas fue elaborada por (Byriel., 1999) y la  segunda por (Jantzen et al., 2009). En (Byriel., 1999) se demostr&oacute; que los  algoritmos de agrupamiento pod&iacute;an obtener errores de clasificaci&oacute;n por debajo  del 5 por ciento para este tipo de problema de clasificaci&oacute;n, obteniendo los  mejores resultados con un <em>Adaptative  Network based Fuzzy Inference System</em> (ANFIS).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Posteriormente  en (Martin, 2003) se utiliza <em>K-Fold  Cross-Validation</em> para medir los errores de una serie de clasificadores  propuestos y se realiza selecci&oacute;n de rasgos usando recocido simulado con el  error&nbsp; de los clasificadores como  heur&iacute;stica para dirigir la b&uacute;squeda. Este hecho demostr&oacute; que el proceso de  selecci&oacute;n de rasgos se encuentra intr&iacute;nsecamente ligado con el clasificador a  emplear tal como lo referencia (Norup, 2005). (Martin, 2003) realiza pruebas  con clasificadores inductivos usando los m&eacute;todos: <em>Hard C-mean clustering</em> (HCM), <em>Fuzzy  C-mean clustering</em> (FCM) y <em>Gustafson-kessel  clustering</em> (GK) en ambas versiones de la base de datos y comparando los  resultados de dichos clasificadores antes y despu&eacute;s de la selecci&oacute;n de rasgos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el a&ntilde;o  2005, ante el surgimiento de nuevos m&eacute;todos de clasificaci&oacute;n Jonas Norup  propone un grupo de t&eacute;cnicas para clasificar los objetos de la base de datos de  Herlev comparando sus resultados con los que ya se hab&iacute;an obtenido  anteriormente. (Norup, 2005) no realiza ning&uacute;n tipo de selecci&oacute;n de rasgos y  hace un grupo de anotaciones referentes al hecho de que seg&uacute;n las descripciones  m&eacute;dicas, los rasgos relacionados con el tama&ntilde;o, la forma, el &aacute;rea y el brillo  de las c&eacute;lulas eran buenos discriminantes; sin hacer ning&uacute;n an&aacute;lisis posterior.  En (Marianakis et al., 2009) se propone un esquema de selecci&oacute;n de rasgos  h&iacute;brido basado en algoritmos gen&eacute;ticos y un algoritmo de clasificaci&oacute;n basado  en los K vecinos m&aacute;s cercanos. El esquema propuesto emplea una configuraci&oacute;n  b&aacute;sica y simple obteniendo buenos resultados de clasificaci&oacute;n en la medida que  se incrementa la precisi&oacute;n del error de validaci&oacute;n cometido en el proceso de  selecci&oacute;n de rasgos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En (Plissiti  and Nikou, 2012) se propone la utilizaci&oacute;n de los rasgos basados exclusivamente  en las caracter&iacute;sticas del n&uacute;cleo celular debido a que los m&eacute;todos de  segmentaci&oacute;n de im&aacute;genes no lograban distinguir eficientemente el &aacute;rea  citoplasm&aacute;tica de las c&eacute;lulas. Para ello se examin&oacute; un grupo de m&eacute;todos de  reducci&oacute;n dimensional no lineal, <em>Kernel  PCA, Isomap, Locally Linear Embedding, Laplacian Eigenmaps</em>, probados en dos  clasificadores no supervisados: <em>Spectral  clustering</em> y <em>Fuzzy C-means</em>. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En (Plissiti  and Nikou, 2012) aparentemente se ignoran algunos trabajos previos como los de (Poulsen  and Pedron, 1995) donde se desarrolla un m&eacute;todo para el trabajo con muestras  donde el solapamiento celular es elevado como para &nbsp;segmentar  las c&eacute;lulas individuales, o el trabajo de (Sobrevilla et al., 2003) donde  propone un algoritmo para la detecci&oacute;n de las mejores &aacute;reas de inter&eacute;s en las  im&aacute;genes de muestras celulares del cuello del &uacute;tero. Recientemente, en (Gen&ccedil;tav  et al., 2012) se emplea un algoritmo de agrupamiento jer&aacute;rquico para la  segmentaci&oacute;n celular, los resultados obtenidos muestran la efectividad de la  propuesta incluso en im&aacute;genes obtenidas de muestras inconsistentes, pobre  contraste y solapamiento. Posteriormente en (Song et al., 2014) se propone un  nuevo m&eacute;todo de segmentaci&oacute;n celular basado en una <em>Convolution Neural Network</em> obteni&eacute;ndose una precisi&oacute;n del 94.5 por  ciento en la detecci&oacute;n del n&uacute;cleo y el citoplasma celular. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En (Curbelo,  2012) se implementan un grupo de clasificadores como las m&aacute;quinas de soporte  vectorial pero sin realizar selecci&oacute;n de rasgos. Posteriormente en (Rodr&iacute;guez-V&aacute;zquez  and Mart&iacute;nez-Borges, 2015) se implementa un algoritmo de clasificaci&oacute;n empleando  m&aacute;quinas de soporte vectorial utilizando solamente los rasgos del n&uacute;cleo. Como puede  apreciarse, hasta el momento el conocimiento acerca de la importancia o  confusi&oacute;n introducida por los rasgos que describen la base de datos de Herlev  es insuficiente. M&aacute;s all&aacute; de un grupo de anotaciones basadas en criterio de  expertos, las t&eacute;cnicas de selecci&oacute;n de rasgos empleadas hasta el momento son el  resultado de m&eacute;todos de b&uacute;squeda heur&iacute;sticos basados en argumentaciones  t&eacute;cnicas de segmentaci&oacute;n de im&aacute;genes que ya han sido solventadas por las nuevas  investigaciones. Se hace necesario contar con informaci&oacute;n certera en este  campo.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tal como se  se&ntilde;ala en (Martin, 2003), no existe un clasificador perfecto que sea capaz de  eliminar el ruido introducido por todos los rasgos a tratar, ni capaz de  aprovechar toda la informaci&oacute;n que aportan. La selecci&oacute;n del conjunto de rasgos  que minimiza el error de un clasificador est&aacute; ligado estrechamente al propio  clasificador. Pero esta idea, aparentemente entra en contradicci&oacute;n con las  anotaciones de (Norup, 2005) al subrayar el poder discriminatorio de aquellos  rasgos relacionados con el tama&ntilde;o, forma, &aacute;rea y brillo de las c&eacute;lulas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este  contexto puede identificarse el siguiente problema: &iquest;Qu&eacute; efecto tiene emplear  una combinaci&oacute;n de rasgos que incluya aquellos de mayor importancia en el  proceso de clasificaci&oacute;n de muestras celulares del cuello del &uacute;tero?</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El objetivo perseguido por la  presente investigaci&oacute;n es desarrollar un m&eacute;todo de selecci&oacute;n de rasgos que  permita calcular una combinaci&oacute;n de caracter&iacute;sticas que incluya aquellas de  mayor importancia informacional y permita clasificar los casos de la base de  datos de Herlev. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La base de datos de Herlev consiste en 917 muestras distribuidas  inequ&iacute;vocamente en 7 clases diferentes abordadas exhaustivamente en (Jantzen et  al., 2009). Cada muestra se encuentra descrita por 20 rasgos. Cada imagen fue  segmentada y examinada por dos expertos del Hospital Universitario de Herlev y  descartada en caso de cualquier desacuerdo con el diagn&oacute;stico. En la <a href="#f01">Tabla (1)</a>  se presenta un resumen de los 20 rasgos presentes en la base de datos de Herlev  relacionados con el n&uacute;mero y el nombre de la caracter&iacute;stica utilizados.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/t0106216.jpg" alt="t01" width="374" height="365"><a name="f01"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Medici&oacute;n del error cometido en el  proceso de clasificaci&oacute;n</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En funci&oacute;n de  obtener una tasa certera de la precisi&oacute;n de un proceso de clasificaci&oacute;n  cualquiera es necesario establecer una medida del error cometido. Existen  varios m&eacute;todos que han sido aplicados en la actualidad con &eacute;xito por ejemplo en  (Rodr&iacute;guez-V&aacute;zquez and Mart&iacute;nez-Borges, 2015) se emplean las medidas AUC,  medida F, predictividad negativa y media H y en (Marianakis et al., 2009) se utiliza <em>Root Mean Squared Error </em>y el error  promedio. En sentido general la medici&oacute;n del error promedio resulta ineficiente  cuando una misma medici&oacute;n puede ser producida por diferentes tipos de errores. El  error promedio ha sido empleado ampliamente por investigaciones precedentes y  es la elecci&oacute;n m&aacute;s evidente para poder contrastar los modelos de clasificaci&oacute;n  propuestos.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el c&aacute;lculo del error  promedio se utiliza la cantidad de objetos clasificados de anormales siendo  normales o falsos positivos (FP); la cantidad de objetos clasificados de  normales siendo anormales o falsos negativos (FN); la cantidad de objetos  clasificados como normales siendo normales o verdaderos negativos (VN); la  cantidad de objetos clasificados como anormales siendo anormales o verdaderos  positivos (VP). El error promedio (EP) que se calcula seg&uacute;n Ecuaci&oacute;n (1). </font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/fo0106216.jpg" alt="fo01" width="241" height="46"></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">K-fold cross-validation</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Normalmente el conjunto de datos se encuentra dividido en un subconjunto de  entrenamiento y otro subconjunto de validaci&oacute;n, por lo general disjuntos. El  conjunto de datos de entrenamiento se usa para construir el clasificador por lo  que utilizarlo para calcular el error promedio cometido traer&iacute;a como  consecuencia una medici&oacute;n inconsistente y es por lo que se utiliza el conjunto de  datos de validaci&oacute;n. En la pr&aacute;ctica mientras m&aacute;s datos de validaci&oacute;n se posean,  mejor ser&aacute; la estimaci&oacute;n del error cometido; y mientras mayor sea la cantidad  datos de entrenamiento, mejor se adaptar&aacute; el clasificador al modelo a  construir. <em>K-fold cross-validation</em> descrito en (Bishop, 1995) provee un mecanismo para utilizar los datos cuando  su disponibilidad es limitada.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Seg&uacute;n (Ru&iacute;z-Shulcloper et al., 1994) dado un conjunto finito de objetos <em>M</em>, sobre los cuales se define un  conjunto de predicados <em>x<sub>1</sub>,  ..., x<sub>n</sub>, x<sub>n + 1</sub></em>; al &uacute;ltimo predicado se le denomina  predicado fundamental y su formulaci&oacute;n en la pr&aacute;ctica es desconocida; siendo su  funci&oacute;n evaluar la pertenencia de un objeto a una clase <em>K<sub>i</sub>, i = 1, ..., r</em>; y al resto de los predicados se les  denomina rasgos.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Definici&oacute;n 1.</font></strong> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se denomina descripci&oacute;n est&aacute;ndar de un objeto, al n-tuplo: <em>I(O) = (x<sub>1</sub>(O), ..., xn(O))</em> donde <em>X<sub>i</sub>(O) &isin; Ai</em> es el  valor del rasgo <em>X<sub>i</sub></em> en el  objeto <em>O</em>, <em>A<sub>i</sub></em> es el conjunto de todos los valores admisibles de <em>Xi</em>, para <em>i=1, ..., n</em>. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo k-fold cross-validation consta de dos pasos. </font></p> <ol start="1" type="1">       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Construcci&oacute;n del modelo y prueba. La idea es       encontrar <em>k</em> particiones de <em>M</em> de tal forma que se escoja       temporalmente una de esas particiones para probar el clasificador y el       resto para construirlo.</font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Validaci&oacute;n cruzada. Escoger una de <em>k</em> particiones puede hacerse de <em>k</em> formas. La validaci&oacute;n cruzada       construye el modelo y lo prueba de las <em>k</em> posibles formas, calculando el error total del modelo como el promedio de       los errores de cada prueba. </font></p>   </li>     </ol>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La distribuci&oacute;n de los objetos en cada partici&oacute;n se realiza de manera aleatoria,  pero realizando un muestreo estratificado para mantener una correcta proporci&oacute;n  del rasgo objetivo en cada segmento. Debido a que el proceso de construcci&oacute;n  del modelo posee una serie de pasos aleatorios, la repetici&oacute;n del proceso no  necesariamente arroja los mismos resultados por lo que se realiza <em>k-fold cross-validation</em> varias veces  calculando el promedio de los errores cometidos en cada iteraci&oacute;n.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Selecci&oacute;n de rasgos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Seg&uacute;n (Martin, 2003), un  algoritmo de clasificaci&oacute;n perfecto ser&iacute;a capaz de corregir la pobreza de los  datos de entrada, pero tal algoritmo no existe. Una forma de conseguir un  subconjunto de rasgos adecuado es probar con todas las combinaciones posibles,  sin embargo, para 20 rasgos ser&iacute;a el equivalente a probar 2<sup>20</sup> subconjuntos  de caracter&iacute;sticas con consecuencias negativas en el rendimiento computacional  de cualquier sistema. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Existen varias metodolog&iacute;as para realizar selecci&oacute;n de rasgos. Como regla  aceptada estos m&eacute;todos pueden clasificarse en basados en filtros, basados en  envoltura y embebidos (Lazar et al., 2012). En la literatura especializada se  reporta el uso de las redes neuronales (Verikas and Bacauskiene, 2002; Niazi et  al., 2004; Saeys), m&eacute;todos basados en optimizaci&oacute;n de enjambres de part&iacute;culas (Bello  et al., 2007), algoritmos gen&eacute;ticos (Marinakis et al., 2009; Hajnayeb et al.,  2011) y otros.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Un enfoque ampliamente  utilizado en los problemas de selecci&oacute;n de rasgos y para el c&aacute;lculo de la  importancia informacional de los rasgos es la teor&iacute;a de testores (Lazo-Cortes  et al., 2001). Esta es una rama de la l&oacute;gica matem&aacute;tica que surgi&oacute; en la Uni&oacute;n  Sovi&eacute;tica a finales de 1950 investigada por (I.A. Cheguis, 1958). A mediados de  1960, Y. I. Zhuravlev adapt&oacute; el concepto de testor al reconocimiento de  patrones y sobre la base del mismo introdujo los conceptos y formas de calcular  los pesos informacionales de rasgos y objetos. Las siguientes definiciones de  testor y testor t&iacute;pico fueron introducidas por (A.N. Dmitriev, 1966). </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Definici&oacute;n 2</font></strong> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Sea <em>M<sub>1</sub></em> el conjunto de  todos los objetos pertenecientes a la clase <em>K<sub>1 </sub></em>,  y<em> M<sub>2</sub> </em>el conjunto de todos  los objetos pertenecientes a la clase<em> K<sub>2</sub></em>.  El conjunto de rasgos <em>T= {x<sub>1</sub>,  ..., x<sub>s</sub>}</em> de la muestra de objetos <em>M</em> se denomina testor para <em>(M<sub>1</sub>,  M<sub>2</sub>) = M</em>, si despu&eacute;s de eliminar de <em>M</em> todos los rasgos excepto los de <em>T</em> no existe objeto alguno en<em> M<sub>1</sub> </em>igual a<em> M<sub>2</sub></em>.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Definici&oacute;n 3</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Un testor <em>T</em> se llama irreducible o t&iacute;pico, si al eliminar cualquier columna  de <em>T</em> deja de ser testor para <em>(M<sub>1</sub>, M<sub>2</sub>) = M</em>.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Medida de la importancia  informacional de los rasgos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Dada la definici&oacute;n de testor t&iacute;pico, se tiene un conjunto de rasgos que son  imprescindibles para discriminar las clases. Seg&uacute;n (A. N. Dmitriev, 1966) es  natural suponer, que, si un rasgo aparece en muchos testores t&iacute;picos, resulta  m&aacute;s dif&iacute;cil prescindir de &eacute;l en el proceso de clasificaci&oacute;n, o sea, es m&aacute;s  importante. Sobre esta idea el autor formula la definici&oacute;n de peso  informacional de un rasgo como la frecuencia relativa de aparici&oacute;n de dicho  rasgo en el conjunto de testores t&iacute;picos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Formalmente,  sea &tau; el conjunto de todos los testores t&iacute;picos que posee cierta matriz de  entrenamiento de un problema de reconocimiento de patrones y sea &tau;<sub>i</sub> el  conjunto de testores t&iacute;picos en los que aparece el rasgo x<sub>i</sub>,  entonces el peso informacional de dicho rasgo viene dado por la Ecuaci&oacute;n (2).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/fo0206216.jpg" alt="fo02" width="210" height="43"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A pesar de que la definici&oacute;n anterior resulta intuitiva, no tiene en  cuenta la longitud de los testores involucrados en el proceso. Por esto se  redefinir&aacute; de acuerdo al autor la expresi&oacute;n de importancia informacional de un  rasgo seg&uacute;n Ecuaci&oacute;n (3).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/fo0306216.jpg" alt="fo03" width="378" height="35"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la Ecuaci&oacute;n  (3) &alpha; y &beta; son par&aacute;metros que ponderan la participaci&oacute;n de P(x<sub>i</sub>) y  L(x<sub>i</sub>). L(x<sub>i</sub>) es una magnitud que depende de la longitud  de los testores en los que aparece el rasgo x<sub>i</sub> y viene dado por la  Ecuaci&oacute;n (4).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/fo0406216.jpg" alt="fo04" width="159" height="56"></p>     ]]></body>
<body><![CDATA[<p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Medida  de la confusi&oacute;n introducida por los rasgos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">De la  definici&oacute;n de testor se deriva que, si una combinaci&oacute;n de rasgos confunde al  menos un par de objetos de clases diferentes, no es testor (Ru&iacute;z-Shulcloper et  al., 1994). Pudiera pensarse que la cantidad de pares de objetos que se  confunden es directamente proporcional a lo que le falta a dicha combinaci&oacute;n de  rasgos para ser testor; una magnitud que expresa cuanto confunde dicho rasgo  durante el proceso de clasificaci&oacute;n. Seg&uacute;n (Lazo-Cortes et al., 2001) la  confusi&oacute;n o error introducido por un rasgo en una muestra de objetos <em>M</em> es el n&uacute;mero de pares de valores  iguales que pertenecen a objetos de clases diferentes. Dicha magnitud viene  dada por la Ecuaci&oacute;n (5).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/fo0506216.jpg" alt="fo05" width="362" height="29"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde C<sub>i</sub> es un criterio de comparaci&oacute;n de semejanza entre  objetos para el rasgo x<sub>i</sub>.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Procedimiento general para la  selecci&oacute;n del mejor conjunto de rasgos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El procedimiento para la selecci&oacute;n del mejor conjunto de rasgos que a  continuaci&oacute;n se describe est&aacute; basado en los siguientes aspectos: en primer lugar,  existen un conjunto de rasgos que conforman el n&uacute;cleo de un modelo y en segundo  lugar el error de clasificaci&oacute;n se encuentra estrechamente ligado a la  capacidad discriminatoria del clasificador empleado.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el siguiente algoritmo, el conjunto de rasgos que conforman el n&uacute;cleo  del modelo a representar por el clasificador es seleccionado haciendo uso de la  teor&iacute;a de testores y ajustado posteriormente con el clasificador. Este ajuste  se realiza de forma emp&iacute;rica mediante recocido simulado (Mitchel, 1997)  empleando el error del clasificador como heur&iacute;stica del algoritmo.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Algoritmo 1</font></strong> </font></p> <ol start="1" type="1">       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Calcular el conjunto de testores t&iacute;picos.</font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Calcular la importancia informacional de los rasgos       y la confusi&oacute;n asociada.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Seleccionar el conjunto de rasgos que conforman el       n&uacute;cleo del modelo a representar.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Ajustar el conjunto de rasgos del n&uacute;cleo del modelo       a representar con el clasificador de prueba. </font></p>   </li>     </ol>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este trabajo se utiliza un grupo de clasificadores de prueba con el  objetivo de establecer comparaciones entre ellos y de esta manera validar el  poder discriminatorio de los conjuntos de rasgos propuestos. Entre  los clasificadores a investigar se encuentran: <em>Hard C-mean clustering</em> (HCM), <em>Fuzzy  C-mean clustering</em> (FCM), <em>Least Square  method</em> (LS) (Krose, 1996) y <em>K-Nearest  Neighbors</em> (KNN).</font></p>     ]]></body>
<body><![CDATA[<p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">C&aacute;lculo del conjunto de testores  t&iacute;picos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Existen varios algoritmos para el c&aacute;lculo de  testores pudi&eacute;ndose clasificar en: algoritmos de escala exterior y algoritmos  de escala interior. Los algoritmos de escala exterior se caracterizan por  recorrer todos los subconjuntos pertenecientes al conjunto potencia de rasgos  de manera exhaustiva. Los algoritmos de escala interior por otro lado se  centran en encontrar un grupo de condiciones que garanticen que determinados  rasgos conforman un testor y por tanto son m&aacute;s complejos de implementar. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este trabajo se emplea el algoritmo BT para  la selecci&oacute;n del subconjunto m&iacute;nimo de rasgos. Un estudio de la literatura  revela que existen otros algoritmos como por ejemplo LEX (Alganza and Porrata,  2003) que posee mayor eficiencia computacional que BT. Sin embargo, en el caso  de la presente investigaci&oacute;n la eficiencia computacional en t&eacute;rminos de  complejidad temporal y espacial sobrepasa el alcance planteado en el objetivo  inicial. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la evaluaci&oacute;n rasgo a rasgo se emplea una funci&oacute;n de diferencia teniendo  en cuenta la distribuci&oacute;n natural de los datos en la base de datos de <em>Herlev</em>. Obs&eacute;rvese en la <a href="/img/revistas/rcci/v10n2/t0206216.jpg" target="_blank">Tabla (2)</a> c&oacute;mo  la media aritm&eacute;tica del rasgo referente a la ratio entre el &aacute;rea del n&uacute;cleo y  el &aacute;rea del citoplasma, coincide para cada una de las siete clases de la base  de datos con las descripciones m&eacute;dicas de los expertos. En ese mismo escenario,  aunque la distribuci&oacute;n de las siete clases es desconocida, la desviaci&oacute;n  est&aacute;ndar brinda una indicaci&oacute;n de la superposici&oacute;n o separaci&oacute;n entre clases. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El objetivo es emplear la informaci&oacute;n asociada a las siete clases de la  base de datos para realizar una clasificaci&oacute;n de objetos normales y anormales.  La funci&oacute;n de diferencia quedar&iacute;a enunciada formalmente mediante la Ecuaci&oacute;n (6).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/fo0606216.jpg" alt="fo06" width="332" height="70"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde <em>&phi; (O<sub>j</sub> ,  O<sub>k</sub>)</em> es la funci&oacute;n de comparaci&oacute;n del rasgo <em>i</em> entre los objetos <em>O<sub>j</sub> </em>y<em> O<sub>k</sub></em>. La funci&oacute;n <em><img src="/img/revistas/rcci/v10n2/fo06.106216.jpg" alt="fo06.1" width="13" height="16">(O<sub>p </sub>)</em> determina la clase a la  cual pertenece el objeto <em>O<sub>p</sub></em> mediante l&oacute;gica difusa y viene dada por la Ecuaci&oacute;n (7).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/fo0706216.jpg" alt="fo07" width="356" height="42"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde <em>dev<sub>ij</sub> </em> expresa  la desviaci&oacute;n t&iacute;pica correspondiente al rasgo <em>i</em> para la clase <em>j</em>; <em>mean<sub>ij</sub></em> expresa la media  aritm&eacute;tica correspondiente al rasgo <em>i</em> para la clase <em>j</em> y <em>x<sub>i</sub>(Op)</em> es el valor  del rasgo <em>i</em> perteneciente al objeto <em>Op</em>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="#t03">Tabla (3)</a> se listan los resultados  obtenidos del c&aacute;lculo de testores: importancia informacional de los rasgos de  la base de datos de Herlev y la confusi&oacute;n que introducen. Con estos datos y  siguiendo el procedimiento general descrito en el Algoritmo 1 es posible  calcular el conjunto de rasgos irreducibles del sistema. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="#t04">Tabla (4)</a> se muestran los rasgos que  mayor cantidad de informaci&oacute;n aportan en el proceso de clasificaci&oacute;n y que no  deben ser obviados.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="/img/revistas/rcci/v10n2/f0106216.jpg" target="_blank">Figura (1)</a> puede apreciarse c&oacute;mo aquellos rasgos que poseen un  mayor ratio entre la importancia informacional y la confusi&oacute;n que introducen en  el proceso de clasificaci&oacute;n, coinciden con aquellos que conforman el conjunto  de rasgos irreducibles </font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/t0306216.jpg" alt="t03" width="573" height="316"><a name="t03"></a></p>     <p align="center">&nbsp;</p>     <p align="center"><img src="/img/revistas/rcci/v10n2/t0406216.jpg" alt="t04" width="543" height="62"><a name="t04"></a></p>     <p align="left"><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Resultados  del clasificador HCM</font></strong></font></p>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los resultados para HCM ser&aacute;n  presentados usando el algoritmo dise&ntilde;ado para FCM con un factor difuso q &asymp; 1,  espec&iacute;ficamente <em>q=1.01</em> que en la  pr&aacute;ctica debe dar un resultado similar. Primeramente, debe determinarse la  cantidad de agrupaciones a usar. Esto se realiz&oacute; realizando mediciones del  error cometido de diferentes cantidades de agrupaciones empleando todos los  rasgos mediante <em>10-fold cross-validation</em> y 20 iteraciones. Los resultados demuestran que, a mayor cantidad de  agrupaciones, menor es el error, por lo que se determina emplear 50  agrupaciones. Los rasgos fueron ajustados empleando 50 iteraciones del  algoritmo recocido simulado a una temperatura de 0.1, calculando en cada  iteraci&oacute;n el error de clasificaci&oacute;n mediante <em>2-fold cross-validation</em>.</font></p>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="#t05">Tabla (5)</a> se muestran las mediciones del error cometido empleando  todos los rasgos, los rasgos extra&iacute;dos por (Martin, 2003), los rasgos  referentes al n&uacute;cleo, propuestos por (Plissiti and Nikou, 2012), los rasgos  extra&iacute;dos en correspondencia al procedimiento general descrito en el Algoritmo  1 y el conjunto de rasgos irreducibles.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/t0506216.jpg" alt="t05" width="556" height="139"><a name="t05"></a></p>     <p align="left"><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Resultados del clasificador FCM</font></strong></font></p>     ]]></body>
<body><![CDATA[<p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para probar el  clasificador FCM primeramente debe elegirse el factor difuso a emplear. Como se  demuestra en (Martin, 2003) existe una dependencia directa entre este par&aacute;metro  y los resultados de clasificaci&oacute;n por lo que debe ajustarse con cuidado. Para  el c&aacute;lculo del error cometido se emplea <em>10-fold  cross-validation</em> y 20 iteraciones. En la <a href="#t06">Tabla (6)</a> se muestra el error  cometido por este clasificador.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/t0606216.jpg" alt="t06" width="550" height="138"><a name="t06"></a></p>     <p align="left"><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Resultados del clasificador LS</font></strong></font></p>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="#t07">Tabla (7)</a> se muestran  los resultados de clasificaci&oacute;n obtenidos del clasificador LS. Para las  mediciones del error de clasificaci&oacute;n se emple&oacute; <em>10-fold cross-validation</em> con 50 iteraciones.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n2/t0706216.jpg" alt="t07" width="566" height="132"><a name="t07"></a></p>     <p align="left"><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Resultados  del clasificador WKNN</font></strong></font></p>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="/img/revistas/rcci/v10n2/t0806216.jpg" target="_blank">Tabla (8)</a>  se muestran los resultados de clasificaci&oacute;n obtenidos del clasificador WKNN. El  algoritmo WKNN es una variante del algoritmo KNN donde la influencia de los  k-vecinos m&aacute;s pr&oacute;ximos es ponderada de acuerdo a su distancia respecto a un  punto de prueba. Para las mediciones del error de clasificaci&oacute;n se emple&oacute; <em>10-fold cross-validation </em>con 50  iteraciones.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El empleo de un m&eacute;todo que tenga en cuenta las caracter&iacute;sticas m&aacute;s  significativas durante el proceso de selecci&oacute;n de rasgos, por lo general  obtiene buenos resultados de clasificaci&oacute;n y suele reducir el error de  clasificaci&oacute;n en 1.8436 por ciento respecto a otras metodolog&iacute;as de selecci&oacute;n  de rasgos reportadas en la literatura. No obstante, queda por demostrar si este  conjunto de rasgos resultantes es el m&aacute;s eficiente o m&aacute;s a&uacute;n cu&aacute;les son los  casos en los que no mejoran en nada los resultados como en el caso del  clasificador LS. Se hace necesario profundizar en el mecanismo de adaptaci&oacute;n  del conjunto de rasgos que conforman el n&uacute;cleo del modelo a representar por un  clasificador cualquiera.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una serie de clasificadores de prueba fueron empleados para medir la  eficiencia de una serie de conjuntos de rasgos discriminantes. Entre estos se  encuentran HCM, FCM, LS y WKNN. El empleo de un mayor grupo de clasificadores  de pruebas se hace necesario. El conjunto de rasgos discriminantes que  conforman el n&uacute;cleo del modelo a representar por un clasificador cualquiera  demostr&oacute; ser un predictor adecuado para el potencial discriminante del mismo.</font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A  HAJNAYEB, A GHASEMLOONIA, SE KHADEM, and MH MORADI. Application and comparison  of an ann-based feature selection method and the genetic algorithm in gearbox  fault diagnosis. Expert Systems with Applications, 38(8):10205-10209, 2011.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ABDOLLAH  KAVOUSI-FARD. A new fuzzy-based feature selection and hybrid tla-ann modelling  for short-term load forecasting. Journal of Experimental &amp; Theoretical  Artificial Intelligence, 25(4):543-557, 2013.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ANDREA  E DAWSON. Can we change the way we screen?: The thinprep imaging system. Cancer  Cytopathology, 102(6):340-344, 2004.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ANTANAS  VERIKAS AND MARIJA BACAUSKIENE. Feature selection with neural networks. Pattern  Recognition Letters, 23(11):1323-1335, 2002.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ASL?  GEN?CTAV, SELIM AKSOY, and SEVGEN ONDER. Unsupervised segmentation and  classification of cervical cell images. Pattern Recognition, 45(12):4151-4168,  2012.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">B.  KROSE. Introduction to neural networks. University of Amsterdam., 8 edition,  1996.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CHIN-WEN  CHANG, MING-YU LIN, HORNG-JYH HARN, YEN-CHERN HARN, CHIEN-HUNG CHEN, KUN-HIS  TSAI, AND CHIHUNG HWANG. Automatic segmentation of abnormal cell nuclei from  microscopic image analysis for cervical cancer screening. In Nano/Molecular  Medicine and Engineering (NANOMED), 2009 IEEE International Conference on,  pages 77-80. IEEE, 2009.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CHRISTOPHER  M. BISHOP. Neural Networks for Pattern Recognition. Oxford University Press,  Inc., 1995.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">COSMIN  LAZAR, JONATAN TAMINAU, STIJN MEGANCK, DAVID STEENHOFF, ALAIN COLETTA, COLIN  MOLTER, VIRGINIE DE SCHAETZEN, ROBIN DUQUE, HUGUES BERSINI, and ANN NOWE. A  survey on filter techniques for feature selection in gene expression microarray  analysis. IEEE/ACM Transactions on Computational  Biology and Bioinformatics (TCBB), 9(4):1106-1119, 2012.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DIANE  SOLOMON, DIANE DAVEY, ROBERT KURMAN, ANN MORIARTY, DENNIS O'CONNOR, MARIANNE  PREY, STEPHEN RAAB, MARK SHERMAN, DAVID WILBUR, THOMAS WRIGHT Jr, et al. The  2001 bethesda system: terminology for reporting results of cervical cytology.  Jama, 287(16):2114-2119, 2002.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">E.  MARTIN. Pap Smear classification. Technical University of Denmark., 2003.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">EUNSANG  BAK, KAYVAN NAJARIAN, and JOHN P BROCKWAY. Efficient segmentation framework of  cell images in noise environments. In Engineering in Medicine and Biology  Society, 2004. IEMBS'04. 26th Annual International Conference of the IEEE,  volume 1, pages 1802-1805. IEEE, 2004.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">F.P.  KRENDELEIEV A.N. DMITRIEV, YU.I. ZHURAVLEV. About the mathematical principles  of patterns and phenomena classification. Journal Diskretnyi Analiz., 7  edition, 1966.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">J  RU&Iacute;Z-SHULCLOPER, E ALBA, and M LAZO. Introducci&oacute;n a  la teor&iacute;a de testores, 1994.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">J.  BYRIEL. Neuro-fuzzy classification of cells in cervial smears. Technical University of Denmark., 1999.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">J.W. CURBELO. Clasificaci&oacute;n de im&aacute;genes de microscop&iacute;a celular en la prueba  de Papanicolau por medios computacionales. Universidad Martha Abreu de las  Villas., 2012.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JAN  JANTZEN, JONAS NORUP, GEORGIOS DOUNIAS, AND BETH BJERREGAARD. Pap-smear  benchmark data for pattern classification. Nature inspired Smart Information  Systems (NiSIS 2005), pages 1-9, 2009.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JONAS  NORUP. Classification of pap-smear data by transductive neuro-fuzzy methods.  Technical University of Denmark., 2005.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JORMA  PAAVONEN. Human papillomavirus infection and the development of cervical cancer  and related genital neoplasias. International Journal of Infectious Diseases,  11:S3-S9, 2007.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KR  NIAZI, CM ARORA, and SL SURANA. Power system security evaluation using ann:  feature selection using divergence. Electric Power Systems Research,  69(2):161-167, 2004.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LAURIE  J MANGO. Reducing false negatives in clinical practice: the role of neural  network technology. American journal of obstetrics and gynecology,  175(4):1114-1119, 1996.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MANUEL LAZO-CORTES, JOSE RUIZ-SHULCLOPER, and EDUARDO ALBA-CABRERA. An  overview of the evolution of the concept of testor. Pattern recognition,  34(4):753-762, 2001.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MARINA  E PLISSITI and CHRISTOPHOROS NIKOU. Cervical cell classification based  exclusively on nucleus features. pages 483-490, 2012.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MEISELS  and MORIN. Cytopathology of the uterus. ASCP Press, 2nd edition, 1997.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">P SOBREVILL, E LERMA, and E MONTSENY. An approach  to a fuzzy-based automatic pap screening system-fapss-paddressed to cytology  cells detection. pages 138-142, 2003.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">RAFAEL BELLO, YUDEL GOMEZ, ANN NOWE, and MARIA M GARCIA. Two-step  particle swarm optimization to solve the feature selection problem. In  Intelligent Systems Design and Applications, 2007. ISDA 2007. Seventh  International Conference on, pages 691-696. IEEE, 2007.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">RONALD  S POULSEN and ILARIO PEDRON. Region of interest finding in reduced resolution  colour imagery. Application to cancer cell detection in cell overlaps and  clusters, volume 1. 1995.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">S.V.  YABLONSKII I.A. CHEGUIS. Logical Methods for controlling electrical systems. Trudy Matematicheskava Institutaimeni V. A. Steklova., 1958.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SOLANGEL RODR&Iacute;GUEZ-V&Aacute;ZQUEZ and ANDY VIDAL MART&Iacute;NEZ-BORGES. Clasificaci&oacute;n de  c&eacute;lulas cervicales con m&aacute;quinas de soporte vectorial empleando rasgos del  n&iacute;cleo. Revista Cubana de Ciencias Inform&aacute;ticas, 9(2), 2015.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">T.  MITCHEL. Machine Learning. McGraw Hill, 1997.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">THOMAS  F KARDOS. The focalpoint system. Cancer Cytopathology, 102(6):334-339, 2004.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">YANNIS  MARINAKIS, GEORGIOS DOUNIAS, and JAN JANTZEN. Pap smear diagnosis using a  hybrid intelligent scheme focusing on genetic algorithm based feature selection  and nearest neighbor classification. Computers in Biology and Medicine,  39(1):69-78, 2009.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">YOUYI  SONG, LING ZHANG, SIPING CHEN, DONG NI, BAOPU LI, YONGJING ZHOU, BAIYING LEI,  and TIANFU WANG. A deep learning based framework for accurate segmentation of  cervical cytoplasm and nuclei. In Engineering in Medicine and Biology Society  (EMBC), 2014 36th Annual International Conference of the IEEE, pages 2903-2906.  IEEE, 2014.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">YOVANIS SANTIESTEBAN ALGANZA and AURORA PONS PORRATA. LEX: Un nuevo  algoritmo para el c&aacute;lculo de los testores t&iacute;picos. REVISTA  CIENCIAS MATEMATICAS, Santiago de Cuba, CUBA, 21(1):2-3, 2003.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">YUNG-FU  CHEN, PO-CHI HUANG, KER-CHENG LIN, HSUAN-HUNG LIN, LI-EN WANG, CHUNG-CHUAN  CHENG, TSUNG-PO CHEN, YUNG-KUAN CHAN, and JOHN Y CHIANG. Semi-automatic  segmentation and classification of pap smear cells. Biomedical and Health  Informatics, IEEE Journal of, 18(1):94-108, 2014.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">YVAN  SAEYS, INAKI INZA, and PEDRO LARRA&Ntilde;AGA. A review of feature selection  techniques in bioinformatics. bioinformatics, 23(19):2507-2517, 2007.    </font></p>     <p>&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 21/02/2015    <br> Aceptado: 29/02/2016</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HAJNAYEB]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[GHASEMLOONIA]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[KHADEM]]></surname>
<given-names><![CDATA[SE]]></given-names>
</name>
<name>
<surname><![CDATA[MORADI]]></surname>
<given-names><![CDATA[MH]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Application and comparison of an ann-based feature selection method and the genetic algorithm in gearbox fault diagnosis]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>38</volume>
<numero>8</numero>
<issue>8</issue>
<page-range>10205-10209</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KAVOUSI-FARD]]></surname>
<given-names><![CDATA[ABDOLLAH]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A new fuzzy-based feature selection and hybrid tla-ann modelling for short-term load forecasting.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>25</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>543-557</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[E DAWSON]]></surname>
<given-names><![CDATA[ANDREA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Can we change the way we screen?: The thinprep imaging system]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>102</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>340-344</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[VERIKAS]]></surname>
<given-names><![CDATA[ANTANAS]]></given-names>
</name>
<name>
<surname><![CDATA[BACAUSKIENE]]></surname>
<given-names><![CDATA[MARIJA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Feature selection with neural networks]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>23</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>1323-1335</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ASL]]></surname>
<given-names><![CDATA[GEN?CTAV]]></given-names>
</name>
<name>
<surname><![CDATA[AKSOY]]></surname>
<given-names><![CDATA[SELIM]]></given-names>
</name>
<name>
<surname><![CDATA[SEVGEN]]></surname>
<given-names><![CDATA[ONDER]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Unsupervised segmentation and classification of cervical cell images]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>45</volume>
<numero>12</numero>
<issue>12</issue>
<page-range>4151-4168</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KROSE]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to neural networks.]]></source>
<year>1996</year>
<edition>8 edition</edition>
<publisher-name><![CDATA[University of Amsterdam.]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHIN-WEN]]></surname>
<given-names><![CDATA[CHANG]]></given-names>
</name>
<name>
<surname><![CDATA[MING-YU]]></surname>
<given-names><![CDATA[LIN]]></given-names>
</name>
<name>
<surname><![CDATA[HORNG-JYH]]></surname>
<given-names><![CDATA[HARN]]></given-names>
</name>
<name>
<surname><![CDATA[YEN-CHERN]]></surname>
<given-names><![CDATA[HARN]]></given-names>
</name>
<name>
<surname><![CDATA[CHIEN-HUNG]]></surname>
<given-names><![CDATA[CHEN]]></given-names>
</name>
<name>
<surname><![CDATA[KUN-HIS]]></surname>
<given-names><![CDATA[TSAI]]></given-names>
</name>
<name>
<surname><![CDATA[HWANG]]></surname>
<given-names><![CDATA[CHIHUNG]]></given-names>
</name>
</person-group>
<source><![CDATA[Automatic segmentation of abnormal cell nuclei from microscopic image analysis for cervical cancer screening.]]></source>
<year>2009</year>
<page-range>pages 77-80.</page-range><publisher-name><![CDATA[IEEE]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHRISTOPHER]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Neural Networks for Pattern Recognition]]></source>
<year>1995</year>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[COSMIN]]></surname>
<given-names><![CDATA[LAZAR]]></given-names>
</name>
<name>
<surname><![CDATA[TAMINAU]]></surname>
<given-names><![CDATA[JONATAN]]></given-names>
</name>
<name>
<surname><![CDATA[MEGANCK]]></surname>
<given-names><![CDATA[STIJN]]></given-names>
</name>
<name>
<surname><![CDATA[STEENHOFF]]></surname>
<given-names><![CDATA[DAVID]]></given-names>
</name>
<name>
<surname><![CDATA[COLETTA]]></surname>
<given-names><![CDATA[ALAIN]]></given-names>
</name>
<name>
<surname><![CDATA[MOLTER]]></surname>
<given-names><![CDATA[COLIN]]></given-names>
</name>
<name>
<surname><![CDATA[DE SCHAETZEN]]></surname>
<given-names><![CDATA[VIRGINIE]]></given-names>
</name>
<name>
<surname><![CDATA[DUQUE]]></surname>
<given-names><![CDATA[ROBIN]]></given-names>
</name>
<name>
<surname><![CDATA[BERSINI]]></surname>
<given-names><![CDATA[HUGUES]]></given-names>
</name>
<name>
<surname><![CDATA[NOWE]]></surname>
<given-names><![CDATA[ANN]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A survey on filter techniques for feature selection in gene expression microarray analysis.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>9</volume><volume>1106-1119</volume>
<numero>4</numero>
<issue>4</issue>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SOLOMON]]></surname>
<given-names><![CDATA[DIANE]]></given-names>
</name>
<name>
<surname><![CDATA[DAVEY]]></surname>
<given-names><![CDATA[DIANE]]></given-names>
</name>
<name>
<surname><![CDATA[KURMAN]]></surname>
<given-names><![CDATA[ROBERT]]></given-names>
</name>
<name>
<surname><![CDATA[MORIARTY]]></surname>
<given-names><![CDATA[ANN]]></given-names>
</name>
<name>
<surname><![CDATA[O'CONNOR]]></surname>
<given-names><![CDATA[DENNIS]]></given-names>
</name>
<name>
<surname><![CDATA[PREY]]></surname>
<given-names><![CDATA[MARIANNE]]></given-names>
</name>
<name>
<surname><![CDATA[RAAB]]></surname>
<given-names><![CDATA[STEPHEN]]></given-names>
</name>
<name>
<surname><![CDATA[SHERMAN]]></surname>
<given-names><![CDATA[MARK]]></given-names>
</name>
<name>
<surname><![CDATA[WILBUR]]></surname>
<given-names><![CDATA[DAVID]]></given-names>
</name>
<name>
<surname><![CDATA[WRIGHT Jr]]></surname>
<given-names><![CDATA[THOMAS]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The 2001 bethesda system: terminology for reporting results of cervical cytology]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>287</volume>
<numero>16</numero>
<issue>16</issue>
<page-range>2114-2119</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MARTIN]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Pap Smear classification]]></source>
<year>2003</year>
<publisher-name><![CDATA[Technical University of Denmark]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[EUNSANG]]></surname>
<given-names><![CDATA[BAK]]></given-names>
</name>
<name>
<surname><![CDATA[KAYVAN]]></surname>
<given-names><![CDATA[NAJARIAN]]></given-names>
</name>
<name>
<surname><![CDATA[BROCKWAY]]></surname>
<given-names><![CDATA[JOHN P]]></given-names>
</name>
</person-group>
<source><![CDATA[Efficient segmentation framework of cell images in noise environments.]]></source>
<year>2004</year>
<volume>volume 1</volume>
<page-range>1802-1805</page-range><publisher-name><![CDATA[IEEE]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KRENDELEIEV]]></surname>
<given-names><![CDATA[F.P.]]></given-names>
</name>
<name>
<surname><![CDATA[DMITRIEV]]></surname>
<given-names><![CDATA[A.N.]]></given-names>
</name>
<name>
<surname><![CDATA[ZHURAVLEV]]></surname>
<given-names><![CDATA[YU.I]]></given-names>
</name>
</person-group>
<source><![CDATA[About the mathematical principles of patterns and phenomena classification.]]></source>
<year>1966</year>
<edition>7 edition</edition>
<publisher-name><![CDATA[Journal Diskretnyi Analiz]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RUÍZ-SHULCLOPER]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[ALBA]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[LAZO]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Introducción a la teoría de testores]]></source>
<year>1994</year>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BYRIEL]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Neuro-fuzzy classification of cells in cervial smears.]]></source>
<year>1999</year>
<publisher-name><![CDATA[Technical University of Denmark]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CURBELO]]></surname>
<given-names><![CDATA[J.W.]]></given-names>
</name>
</person-group>
<source><![CDATA[Clasificación de imágenes de microscopía celular en la prueba de Papanicolau por medios computacionales.]]></source>
<year>2012</year>
<publisher-name><![CDATA[Universidad Martha Abreu de las Villas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[JANTZEN]]></surname>
<given-names><![CDATA[JAN]]></given-names>
</name>
<name>
<surname><![CDATA[NORUP]]></surname>
<given-names><![CDATA[JONAS]]></given-names>
</name>
<name>
<surname><![CDATA[DOUNIAS]]></surname>
<given-names><![CDATA[GEORGIOS]]></given-names>
</name>
<name>
<surname><![CDATA[BJERREGAARD]]></surname>
<given-names><![CDATA[BETH]]></given-names>
</name>
</person-group>
<source><![CDATA[Pap-smear benchmark data for pattern classification]]></source>
<year>2009</year>
<page-range>pages 1-9</page-range></nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[NORUP]]></surname>
<given-names><![CDATA[JONAS]]></given-names>
</name>
</person-group>
<source><![CDATA[Classification of pap-smear data by transductive neuro-fuzzy methods.]]></source>
<year>2005</year>
<publisher-name><![CDATA[Technical University of Denmark]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[PAAVONEN]]></surname>
<given-names><![CDATA[JORMA]]></given-names>
</name>
</person-group>
<source><![CDATA[Human papillomavirus infection and the development of cervical cancer and related genital neoplasias.]]></source>
<year>2007</year>
<publisher-name><![CDATA[International Journal of Infectious Diseases]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[NIAZI]]></surname>
<given-names><![CDATA[KR]]></given-names>
</name>
<name>
<surname><![CDATA[ARORA]]></surname>
<given-names><![CDATA[CM]]></given-names>
</name>
<name>
<surname><![CDATA[SURANA]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Power system security evaluation using ann: feature selection using divergence.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>69</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>161-167</page-range></nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MANGO]]></surname>
<given-names><![CDATA[LAURIE J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reducing false negatives in clinical practice: the role of neural network technology]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>175</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>1114-1119</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LAZO-CORTES]]></surname>
<given-names><![CDATA[MANUEL]]></given-names>
</name>
<name>
<surname><![CDATA[RUIZ-SHULCLOPER]]></surname>
<given-names><![CDATA[JOSE]]></given-names>
</name>
<name>
<surname><![CDATA[ALBA-CABRERA]]></surname>
<given-names><![CDATA[EDUARDO]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An overview of the evolution of the concept of testor.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>34</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>753-762</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[E PLISSITI]]></surname>
<given-names><![CDATA[MARINA]]></given-names>
</name>
<name>
<surname><![CDATA[CHRISTOPHOROS]]></surname>
<given-names><![CDATA[NIKOU]]></given-names>
</name>
</person-group>
<source><![CDATA[Cervical cell classification based exclusively on nucleus features]]></source>
<year>2012</year>
<page-range>pages 483-490</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MEISELS]]></surname>
</name>
<name>
<surname><![CDATA[MORIN]]></surname>
</name>
</person-group>
<source><![CDATA[Cytopathology of the uterus]]></source>
<year>1997</year>
<edition>2nd edition</edition>
<publisher-name><![CDATA[ASCP Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SOBREVILL]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[LERMA]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[MONTSENY]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[An approach to a fuzzy-based automatic pap screening system-fapss-paddressed to cytology cells detection.]]></source>
<year>2003</year>
<page-range>pages 138-142</page-range></nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BELLO]]></surname>
<given-names><![CDATA[RAFAEL]]></given-names>
</name>
<name>
<surname><![CDATA[GOMEZ]]></surname>
<given-names><![CDATA[YUDEL]]></given-names>
</name>
<name>
<surname><![CDATA[NOWE]]></surname>
<given-names><![CDATA[ANN]]></given-names>
</name>
<name>
<surname><![CDATA[M GARCIA]]></surname>
<given-names><![CDATA[MARIA]]></given-names>
</name>
</person-group>
<source><![CDATA[Two-step particle swarm optimization to solve the feature selection problem.]]></source>
<year>2007</year>
<page-range>691-696</page-range><publisher-name><![CDATA[IEEE]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[POULSEN]]></surname>
<given-names><![CDATA[RONALD S]]></given-names>
</name>
<name>
<surname><![CDATA[ILARIO]]></surname>
<given-names><![CDATA[PEDRON]]></given-names>
</name>
</person-group>
<source><![CDATA[Region of interest finding in reduced resolution colour imagery.]]></source>
<year>1995</year>
<volume>volume 1.</volume>
</nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[S.V. YABLONSKII I.A.]]></surname>
<given-names><![CDATA[CHEGUIS]]></given-names>
</name>
</person-group>
<source><![CDATA[Logical Methods for controlling electrical systems]]></source>
<year>1958</year>
</nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RODRÍGUEZ-VÁZQUEZ]]></surname>
<given-names><![CDATA[SOLANGEL]]></given-names>
</name>
<name>
<surname><![CDATA[VIDAL MARTÍNEZ-BORGES]]></surname>
<given-names><![CDATA[ANDY]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Clasificación de células cervicales con máquinas de soporte vectorial empleando rasgos del nícleo]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>9</volume>
<numero>2</numero>
<issue>2</issue>
</nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MITCHEL]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Machine Learning]]></source>
<year>1997</year>
</nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KARDOS]]></surname>
<given-names><![CDATA[THOMAS F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The focalpoint system]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>102</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>334-339</page-range></nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MARINAKIS]]></surname>
<given-names><![CDATA[YANNIS]]></given-names>
</name>
<name>
<surname><![CDATA[DOUNIAS]]></surname>
<given-names><![CDATA[GEORGIOS]]></given-names>
</name>
<name>
<surname><![CDATA[JANTZEN]]></surname>
<given-names><![CDATA[JAN]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Pap smear diagnosis using a hybrid intelligent scheme focusing on genetic algorithm based feature selection and nearest neighbor classification.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>39</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>69-78</page-range></nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SONG]]></surname>
<given-names><![CDATA[YOUYI]]></given-names>
</name>
<name>
<surname><![CDATA[ZHANG]]></surname>
<given-names><![CDATA[LING]]></given-names>
</name>
<name>
<surname><![CDATA[SIPING]]></surname>
<given-names><![CDATA[CHEN]]></given-names>
</name>
<name>
<surname><![CDATA[DONG]]></surname>
<given-names><![CDATA[NI]]></given-names>
</name>
<name>
<surname><![CDATA[LI]]></surname>
<given-names><![CDATA[BAOPU]]></given-names>
</name>
<name>
<surname><![CDATA[ZHOU]]></surname>
<given-names><![CDATA[YONGJING]]></given-names>
</name>
<name>
<surname><![CDATA[LEI]]></surname>
<given-names><![CDATA[BAIYING]]></given-names>
</name>
<name>
<surname><![CDATA[TIANFU]]></surname>
<given-names><![CDATA[WANG]]></given-names>
</name>
</person-group>
<source><![CDATA[A deep learning based framework for accurate segmentation of cervical cytoplasm and nuclei]]></source>
<year>2014</year>
<page-range>2903-2906</page-range><publisher-name><![CDATA[IEEE]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SANTIESTEBAN ALGANZA]]></surname>
<given-names><![CDATA[YOVANIS]]></given-names>
</name>
<name>
<surname><![CDATA[PONS PORRATA]]></surname>
<given-names><![CDATA[AURORA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[LEX: Un nuevo algoritmo para el cálculo de los testores típicos]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>21</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>2-3</page-range><publisher-loc><![CDATA[^eSantiago de Cuba Santiago de Cuba]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[YUNG-FU]]></surname>
<given-names><![CDATA[CHEN]]></given-names>
</name>
<name>
<surname><![CDATA[HUANG]]></surname>
<given-names><![CDATA[PO-CHI]]></given-names>
</name>
<name>
<surname><![CDATA[KER-CHENG]]></surname>
<given-names><![CDATA[LIN]]></given-names>
</name>
<name>
<surname><![CDATA[HSUAN-HUNG]]></surname>
<given-names><![CDATA[LIN]]></given-names>
</name>
<name>
<surname><![CDATA[LI-EN]]></surname>
<given-names><![CDATA[WANG]]></given-names>
</name>
<name>
<surname><![CDATA[CHUNG-CHUAN]]></surname>
<given-names><![CDATA[CHENG]]></given-names>
</name>
<name>
<surname><![CDATA[TSUNG-PO]]></surname>
<given-names><![CDATA[CHEN]]></given-names>
</name>
<name>
<surname><![CDATA[YUNG-KUAN]]></surname>
<given-names><![CDATA[CHAN]]></given-names>
</name>
<name>
<surname><![CDATA[JOHN]]></surname>
<given-names><![CDATA[Y CHIANG]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Semi-automatic segmentation and classification of pap smear cells]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>18</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>94-108</page-range></nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[YVAN]]></surname>
<given-names><![CDATA[SAEYS]]></given-names>
</name>
<name>
<surname><![CDATA[INAKI]]></surname>
<given-names><![CDATA[INZA]]></given-names>
</name>
<name>
<surname><![CDATA[LARRAÑAGA]]></surname>
<given-names><![CDATA[PEDRO]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A review of feature selection techniques in bioinformatics.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>23</volume>
<numero>19</numero>
<issue>19</issue>
<page-range>2507-2517</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
