<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1684-1859</journal-id>
<journal-title><![CDATA[Revista Cubana de Informática Médica]]></journal-title>
<abbrev-journal-title><![CDATA[RCIM]]></abbrev-journal-title>
<issn>1684-1859</issn>
<publisher>
<publisher-name><![CDATA[Universidad de Ciencias Médicas de La Habana]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1684-18592016000200008</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Herramienta alternativa para la clasificación de células cervicales utilizando solo rasgos del núcleo]]></article-title>
<article-title xml:lang="en"><![CDATA[Alternative tool for classification of cervical cells using only features of the nucleus]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rodríguez Vázquez]]></surname>
<given-names><![CDATA[Solangel]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Martínez Borges]]></surname>
<given-names><![CDATA[Andy Vidal]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas  ]]></institution>
<addr-line><![CDATA[Ciudad de la Habana La Lisa]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2016</year>
</pub-date>
<volume>8</volume>
<numero>2</numero>
<fpage>224</fpage>
<lpage>238</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S1684-18592016000200008&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S1684-18592016000200008&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S1684-18592016000200008&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[El cáncer de cérvix uterino representa una de las mayores amenazas de muerte por cáncer entre las mujeres. Con el avance continuo en la medicina y la tecnología, las muertes por esta enfermedad han disminuido significativamente. Las investigaciones referentes a este tema han podido determinar síntomas claves que permiten detectar a tiempo esta enfermedad para darle un tratamiento oportuno. La citología convencional es una de las técnicas más utilizadas, siendo ampliamente aceptada, de bajo costo, y con mecanismos de control. Con el objetivo de aliviar la carga de trabajo a los especialistas, algunos investigadores han propuesto el desarrollo de herramientas de visión computacional para detectar y clasificar las transformaciones en las células de la región del cuello uterino. La presente investigación tiene como objetivo proveer a los investigadores de una herramienta de clasificación automática, aplicable a las condiciones existentes en los centros médicos y de investigación del país. Esta herramienta debe ser capaz de clasificar las células del cuello del útero, basándose solamente en las características extraídas de la región del núcleo y sin utilizar las características del citoplasma, de manera que se reduzca la tasa de falsos negativos en la prueba de Papanicolaou. A partir del estudio realizado, se obtuvo una herramienta haciendo uso de la técnica k-vecinos más cercanos con la distancia manhattan, el cual mostró un alto desempeño manteniendo valores de AUC superiores al 91% y llegando hasta un 97.1% con respecto a los clasificadores SVM y RBF Network, los que también fueron analizados.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Cervix cancer is one of the biggest threats of cancer death among women. With continued advances in medicine and technology, deaths from the disease have fallen significantly. The investigations concerning this issue have determined key symptoms to detect the disease in time to give timely treatment. Conventional cytology is one of the most widely used techniques, being widely accepted, inexpensive, and with control mechanisms. In order to alleviate the workload of specialists, some researchers have proposed the development of computer vision tools to detect and classify the changes in the cells of the cervical region. This research aims to provide a tool for automatic classification, applicable to medical conditions and research centers of the country. This tool should be able to classify the cells of the cervix, based solely on the features extracted from the core region without using the characteristics of the cytoplasm, so that the rate of false negative Pap test is reduced. From the study, a tool is obtained using the k nearest-neighbors manhattan distance technique, which showed a high performance maintaining AUC values greater than 91% and reaching 97.1% over classifiers SVM and RBF Network, which were also analyzed.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[cáncer de cérvix uterino]]></kwd>
<kwd lng="es"><![CDATA[células del cuello uterino]]></kwd>
<kwd lng="es"><![CDATA[clasificación de células]]></kwd>
<kwd lng="es"><![CDATA[kNN]]></kwd>
<kwd lng="es"><![CDATA[núcleos celulares]]></kwd>
<kwd lng="es"><![CDATA[SVM]]></kwd>
<kwd lng="es"><![CDATA[distancias]]></kwd>
<kwd lng="en"><![CDATA[cervix cancer]]></kwd>
<kwd lng="en"><![CDATA[cervical cells]]></kwd>
<kwd lng="en"><![CDATA[cell classification]]></kwd>
<kwd lng="en"><![CDATA[kNN]]></kwd>
<kwd lng="en"><![CDATA[cell nucleus]]></kwd>
<kwd lng="en"><![CDATA[SVM]]></kwd>
<kwd lng="en"><![CDATA[distances]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font size="2" face="Verdana"><b>ART&Iacute;CULO ORIGINAL</b></font></p>     <p align="right">&nbsp;</p>     <p align="left"><strong><font size="4" face="Verdana">Herramienta alternativa    para la clasificaci&oacute;n de c&eacute;lulas cervicales utilizando solo rasgos    del n&uacute;cleo</font></strong></p>     <p align="left">&nbsp;</p>     <p align="left"><font size="3" face="Verdana"><strong>Alternative tool for classification    of cervical cells using only features of the nucleus </strong></font></p>     <p align="left">&nbsp;</p>     <p align="left">&nbsp;</p>     <p align="left"><strong><font size="2" face="Verdana">MSc. Solangel Rodr&iacute;guez    V&aacute;zquez,</font><font face="Verdana"><strong><font size="2"><strong><font face="Verdana"><sup>I</sup></font></strong></font></strong></font><font size="2" face="Verdana">    Ing. Andy Vidal Mart&iacute;nez Borges</font><font face="Verdana"><strong><font size="2"><strong><font face="Verdana"><sup>I</sup></font></strong></font></strong></font><font face="Verdana"><strong><font size="2"><strong><font face="Verdana"><sup>I</sup></font></strong></font></strong></font></strong></p>     <P><font size="2" face="Verdana">I Universidad de las Ciencias Inform&aacute;ticas.    Km 2&#189; carretera San Antonio de los Ba&ntilde;os, Rpto. Torrens, La Lisa,    Ciudad de la Habana, Cuba. E-mail: <a href="mailtosvazquez@uci.cu">svazquez@uci.cu</a>    <br>   </font><font size="2" face="Verdana">II Empresa de tecnolog&iacute;a para la    defensa, XETID. Km 2&#189; carretera San Antonio de los Ba&ntilde;os, Rpto.    Torrens, La Lisa, Ciudad de la Habana, Cuba. E-mail: <a href="mailto:avmartinez@xetid.cu">avmartinez@xetid.cu</a></font>     ]]></body>
<body><![CDATA[<P>&nbsp;     <P>&nbsp; <hr> <strong><font size="2" face="Verdana">RESUMEN</font></strong>     <P><font size="2" face="Verdana"> El c&aacute;ncer de c&eacute;rvix uterino representa    una de las mayores amenazas de muerte por c&aacute;ncer entre las mujeres. Con    el avance continuo en la medicina y la tecnolog&iacute;a, las muertes por esta    enfermedad han disminuido significativamente. Las investigaciones referentes    a este tema han podido determinar s&iacute;ntomas claves que permiten detectar    a tiempo esta enfermedad para darle un tratamiento oportuno. La citolog&iacute;a    convencional es una de las t&eacute;cnicas m&aacute;s utilizadas, siendo ampliamente    aceptada, de bajo costo, y con mecanismos de control. Con el objetivo de aliviar    la carga de trabajo a los especialistas, algunos investigadores han propuesto    el desarrollo de herramientas de visi&oacute;n computacional para detectar y    clasificar las transformaciones en las c&eacute;lulas de la regi&oacute;n del    cuello uterino. La presente investigaci&oacute;n tiene como objetivo proveer    a los investigadores de una herramienta de clasificaci&oacute;n autom&aacute;tica,    aplicable a las condiciones existentes en los centros m&eacute;dicos y de investigaci&oacute;n    del pa&iacute;s. Esta herramienta debe ser capaz de clasificar las c&eacute;lulas    del cuello del &uacute;tero, bas&aacute;ndose solamente en las caracter&iacute;sticas    extra&iacute;das de la regi&oacute;n del n&uacute;cleo y sin utilizar las caracter&iacute;sticas    del citoplasma, de manera que se reduzca la tasa de falsos negativos en la prueba    de Papanicolaou. A partir del estudio realizado, se obtuvo una herramienta haciendo    uso de la t&eacute;cnica k-vecinos m&aacute;s cercanos con la distancia manhattan,    el cual mostr&oacute; un alto desempe&ntilde;o manteniendo valores de AUC superiores    al 91% y llegando hasta un 97.1% con respecto a los clasificadores SVM y RBF    Network, los que tambi&eacute;n fueron analizados. </font>     <P><font size="2" face="Verdana"><strong>Palabras Clave:</strong> c&aacute;ncer    de c&eacute;rvix uterino, c&eacute;lulas del cuello uterino, clasificaci&oacute;n    de c&eacute;lulas, kNN, n&uacute;cleos celulares, SVM, distancias.</font> <hr> <font size="2" face="Verdana"><strong>ABSTRACT</strong></font>     <P><font size="2" face="Verdana"> Cervix cancer is one of the biggest threats    of cancer death among women. With continued advances in medicine and technology,    deaths from the disease have fallen significantly. The investigations concerning    this issue have determined key symptoms to detect the disease in time to give    timely treatment. Conventional cytology is one of the most widely used techniques,    being widely accepted, inexpensive, and with control mechanisms. In order to    alleviate the workload of specialists, some researchers have proposed the development    of computer vision tools to detect and classify the changes in the cells of    the cervical region. This research aims to provide a tool for automatic classification,    applicable to medical conditions and research centers of the country. This tool    should be able to classify the cells of the cervix, based solely on the features    extracted from the core region without using the characteristics of the cytoplasm,    so that the rate of false negative Pap test is reduced. From the study, a tool    is obtained using the k nearest-neighbors manhattan distance technique, which    showed a high performance maintaining AUC values greater than 91% and reaching    97.1% over classifiers SVM and RBF Network, which were also analyzed. </font>     <P><font size="2" face="Verdana"><strong>Key Words:</strong> cervix cancer, cervical    cells, cell classification, kNN, cell nucleus, SVM, distances. </font> <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana"><strong>INTRODUCCI&Oacute;N</strong> </font></p>     <P><font size="2" face="Verdana">El c&aacute;ncer de c&eacute;rvix uterino es    una de las enfermedades m&aacute;s frecuentes entre las mujeres, aunque m&aacute;s    del 80% se produce en pa&iacute;ses en v&iacute;as de desarrollo. El cribado    de c&aacute;ncer de c&eacute;rvix ha demostrado su efectividad para reducir    la incidencia y la mortalidad por esta enfermedad, especialmente cuando se realiza    a trav&eacute;s de programas poblacionales organizados. </font>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">Debido al car&aacute;cter masivo de su aplicaci&oacute;n    en la poblaci&oacute;n femenina, la prueba de Papanicolaou genera una considerable    carga de trabajo para los laboratorios que analizan en el microscopio los frotis    resultantes de esta t&eacute;cnica citol&oacute;gica. En un frotis t&iacute;pico    se pueden encontrar hasta 300000 c&eacute;lulas, lo que limita la productividad    a no m&aacute;s de unas 60-80 citolog&iacute;as por d&iacute;a de trabajo y    observador.<sup>1</sup> Adem&aacute;s de esto, a partir de la experiencia de la aplicaci&oacute;n    de esta prueba durante muchos a&ntilde;os, se ha podido determinar que existen    diferentes factores que afectan la calidad de los resultados. Estos son, principalmente,    los errores en la toma de las muestras, en su procesamiento y en su lectura    e interpretaci&oacute;n. Sobre este &uacute;ltimo caso, la necesidad de analizar    una gran cantidad de muestras con muy baja tasa de casos positivos tiende a    sesgar el resultado de la evaluaci&oacute;n, y adem&aacute;s provoca errores    debidos a la rutina y a la fatiga de los analistas. </font>     <P><font size="2" face="Verdana">&quot;Si tenemos en cuenta que la esperanza de    vida promedio de la mujer en nuestro pa&iacute;s es de 80 a&ntilde;os, con cada    fallecimiento se pierden 30 a&ntilde;os de vida potenciales, por lo que es la    principal causa de muerte prematura en la poblaci&oacute;n femenina cubana.    La carga para la sociedad es entonces muy alta, adem&aacute;s de la discapacidad    que genera en aquellas que no fallecen&quot;.<sup>2</sup> </font>     <P><font size="2" face="Verdana">La presente investigaci&oacute;n tiene como objetivo    proveer a los investigadores de una herramienta de clasificaci&oacute;n autom&aacute;tica,    aplicable a las condiciones existentes en los centros m&eacute;dicos y de investigaci&oacute;n    del pa&iacute;s. </font>     <P>&nbsp;     <P><font size="3" face="Verdana"> <strong>CONTENIDO</strong> </font>      <P><font size="2" face="Verdana">La necesidad de agilizar y aumentar la calidad    de las pruebas citol&oacute;gicas, sirve de motivaci&oacute;n para la construcci&oacute;n    de una herramienta de apoyo a la detecci&oacute;n temprana de posibles enfermedades    en el c&eacute;rvix uterino. Mediante el uso de algoritmos de clasificaci&oacute;n,    y comparando una base de entrenamiento con una matriz de rasgos extra&iacute;dos    de las im&aacute;genes a evaluar, se puede obtener una clasificaci&oacute;n    de las c&eacute;lulas obtenidas a trav&eacute;s de la prueba citol&oacute;gica.    </font>     <P><font size="2" face="Verdana">Una muestra recogida en dichas pruebas contiene    varias c&eacute;lulas en s&iacute; misma, las cuales se solapan unas a otras    interfiriendo en la delimitaci&oacute;n de la regi&oacute;n del citoplasma perteneciente    a una c&eacute;lula u otra, no siendo as&iacute; en el caso del n&uacute;cleo,    que, como se muestra en las <a href="#fig1">figuras 1</a>(a) y 1(b) es posible    identificarlo. De hecho, la regi&oacute;n del n&uacute;cleo celular resulta    m&aacute;s factible de ser segmentada con precisi&oacute;n mediante algoritmos    de procesamiento digital de im&aacute;genes, siendo este pre-procesamiento un    tema no abordado dentro de esta investigaci&oacute;n. Atendiendo a investigaciones    realizadas por<sup>3,4</sup> y a lo anteriormente expuesto las pruebas y muestras    a utilizar en la validaci&oacute;n de la herramienta ser&aacute;n con los rasgos    extra&iacute;dos de la regi&oacute;n del n&uacute;cleo. </font>      <P align="center"><img src="/img/revistas/rcim/v8n2/f0108216.jpg" width="377" height="161"> <a name="fig1"></a>     <P><strong><font size="2" face="Verdana">Caracterizaci&oacute;n de las fases del    proceso </font> </strong>     <P><font size="2" face="Verdana">En la <a href="#fig2">figura 2</a> se muestra    el diagrama de flujo de la herramienta desarrollada. Dicha soluci&oacute;n est&aacute;    compuesta por 2 fases en las cuales las matrices de rasgos (base de entrenamiento    (<em>m x n</em>)) y (prueba ( <em>m x n</em>)) son validadas (estructuralmente)    para que puedan ser utilizadas por el clasificador, donde son los casos y los    rasgos asociados a los casos. Luego de validada la estructura interna de dichas    matrices de rasgos, comienza la fase de clasificaci&oacute;n la cual brinda    como resultado/salida una matriz de resultado ( <em>m x 1</em>). </font>      ]]></body>
<body><![CDATA[<P align="center"><img src="/img/revistas/rcim/v8n2/f0208216.jpg" width="447" height="203"> <a name="fig2"></a>     <P><font size="2" face="Verdana">En la fase de validaci&oacute;n se propone como    entrada que las matrices de rasgos utilizadas tanto como base de entrenamiento,    as&iacute; como los ficheros de prueba, posean una estructura interna de la    siguiente manera (<a href="#fig3">Fig. 3</a>): </font>      <P align="center"><img src="/img/revistas/rcim/v8n2/f0308216.jpg" width="472" height="193"> <a name="fig3"></a>     <P><font size="2" face="Verdana">El primer valor representa la clasificaci&oacute;n    del caso (para los casos normales y para los casos an&oacute;malos), posteriormente    se observa una estructura, donde representa el rasgo que puede variar desde    siempre de forma ascendente, los act&uacute;an como separador y representa el    valor del rasgo extra&iacute;do de la c&eacute;lula. As&iacute; mismo se evidenciar&iacute;a    en el caso del fichero de prueba (<a href="#fig4">Fig. 4</a>), con la diferencia    de que el valor de la clasificaci&oacute;n del caso siempre tomar&iacute;a el    valor. </font>      <P align="center"><img src="/img/revistas/rcim/v8n2/f0408216.jpg" width="433" height="128"> <a name="fig4"></a>     <P><font size="2" face="Verdana">Para llevar a cabo la fase de clasificaci&oacute;n    es necesario haber obtenido con anterioridad las matrices de rasgos (base de    conocimiento) y (fichero de prueba) a clasificar. Posteriormente se utiliza    la funcionalidad de clasificar y la herramienta devolver&aacute; un fichero    que contiene la clasificaci&oacute;n (enferma o sana) de las c&eacute;lulas    en el mismo orden en el que se encuentran en el fichero de prueba. </font>      <P><strong><font size="2" face="Verdana"> Descripci&oacute;n y metodolog&iacute;a    de uso de los algoritmos propuestos </font> </strong>     <P><font size="2" face="Verdana">Varios m&eacute;todos han sido propuestos para    la clasificaci&oacute;n de las c&eacute;lulas en las im&aacute;genes de la prueba    de Papanicolaou y que se refieren a las t&eacute;cnicas tales como clasificadores    bayesianos,<sup>5</sup> redes neuronales artificiales,<sup>6</sup> m&aacute;quinas    de soporte vectorial (SVM)<sup>7</sup> y vecinos m&aacute;s cercanos.<sup>8</sup>    Debe tenerse en cuenta que la mayor&iacute;a de estos m&eacute;todos utilizan    im&aacute;genes pre-segmentadas que contienen solo una c&eacute;lula, por lo    que la segmentaci&oacute;n correcta del n&uacute;cleo y del citoplasma es factible    (<a href="#fig5">Fig. 5 (a)</a>). </font>      <P><font size="2" face="Verdana">En las im&aacute;genes que contienen grupos de    c&eacute;lulas (<a href="#fig5">Fig. 5 (b)</a>), la detecci&oacute;n de la frontera    del citoplasma es un problema dif&iacute;cil, y hasta ahora, no se ha encontrado    ninguna t&eacute;cnica en la literatura estudiada que mencione algoritmos con    buenos resultados en la delimitaci&oacute;n de las fronteras de la regi&oacute;n    del citoplasma. Sin embargo, la detecci&oacute;n y segmentaci&oacute;n de los    n&uacute;cleos de las im&aacute;genes que contienen c&eacute;lulas superpuestas    y agrupaciones de c&eacute;lulas ha sido abordado con &eacute;xito en varios    estudios.<sup>9,10</sup> </font>      <P align="center"><img src="/img/revistas/rcim/v8n2/f0508216.jpg" width="527" height="140"> <a name="fig5"></a>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">Los m&eacute;todos que se refieren a la clasificaci&oacute;n    de im&aacute;genes de Papanicolaou se basan en el c&aacute;lculo de las caracter&iacute;sticas    (<a href="#tab1">Tabla 1</a>) extra&iacute;das tanto de la regi&oacute;n del    n&uacute;cleo como del citoplasma. En el caso de la presente investigaci&oacute;n    es importante este an&aacute;lisis, debido a que la entrada para el clasificador    es una matriz (donde los casos son cada una de las c&eacute;lulas) con cada    uno de los rasgos extra&iacute;dos de las im&aacute;genes.<sup>11</sup></font>      <P><font size="2" face="Verdana">En algunas investigaciones como es el caso de<sup>3</sup>    se hace uso de los 9 rasgos del n&uacute;cleo y t&eacute;cnicas como spectral    clustering y fuzzy C-means con reducci&oacute;n de la dimensionalidad, a diferencia    de la presente investigaci&oacute;n que se dirige hacia la selecci&oacute;n    de un clasificador sin reducci&oacute;n donde solo se utilizan 5 rasgos de los    9 como son: el &aacute;rea, el per&iacute;metro, el di&aacute;metro corto, di&aacute;metro    m&aacute;s largo y la redondez. </font>      <P><font size="2" face="Verdana">Esta selecci&oacute;n de rasgos persigue demostrar    que, a partir de un conjunto simplificado de datos geom&eacute;tricos b&aacute;sicos,    es posible realizar de forma efectiva la clasificaci&oacute;n binaria de im&aacute;genes    en la prueba de Papanicolaou.<sup>9</sup> </font>      <P><font size="2" face="Verdana">La extracci&oacute;n de rasgos es uno de los    pasos fundamentales en el procesamiento de im&aacute;genes debido a que mientras    mejor sea la selecci&oacute;n de los atributos, m&aacute;s acertada ser&aacute;    la clasificaci&oacute;n final de las c&eacute;lulas. Esto hace que la adecuada    selecci&oacute;n de los rasgos sea una de las limitantes en las investigaciones    para la clasificaci&oacute;n de im&aacute;genes, de no contar con los rasgos    apropiados los resultados obtenidos por el clasificador no tendr&aacute;n la    calidad que se necesita.<sup>12</sup> Para el caso de la presente investigaci&oacute;n, las    matrices de rasgos utilizadas fueron extra&iacute;das de las im&aacute;genes    ya previamente segmentadas (<a href="/img/revistas/rcim/v8n2/f0608216.jpg">Fig. 6(b)</a>) pertenecientes    a la base de datos Herlev.<sup>13</sup> </font>      <P align="center"><img src="/img/revistas/rcim/v8n2/t0108216.gif" width="499" height="425"> <a name="tab1"></a>     <P><font size="2" face="Verdana">Para ello se hizo uso de la herramienta Matlab    y de las funciones propias de la misma. De esta forma se desarroll&oacute; un    algoritmo que toma aleatoriamente de la base de datos Herlev un 80% de las im&aacute;genes    y extrae de ellas (<a href="/img/revistas/rcim/v8n2/f0608216.jpg">Fig. 6 (b)</a>) los rasgos    antes mencionados. A continuaci&oacute;n el algoritmo crea una matriz con los    rasgos extra&iacute;dos de las im&aacute;genes, la que ser&aacute; utilizada    en el entrenamiento del clasificador. </font>      <P><font size="2" face="Verdana">Posteriormente el algoritmo extrae los rasgos    del 20% de las im&aacute;genes restantes y conforma la matriz de rasgos que    se utilizar&aacute; para realizar las pruebas. Estas matrices tienen como caracter&iacute;stica    fundamental que poseen vectores de rasgos diferentes lo que posibilita una evaluaci&oacute;n    correcta del funcionamiento del clasificador. </font>      <P><font size="2" face="Verdana">Para dar cumplimiento al objetivo propuesto en    la presente investigaci&oacute;n se defini&oacute; utilizar para la comparaci&oacute;n    y posterior selecci&oacute;n, tres algoritmos de clasificaci&oacute;n: las m&aacute;quinas    de soporte vectorial (SVM), la b&uacute;squeda por el vecino m&aacute;s cercano    (kNN) y las redes neurales artificiales (RNA). Con el fin de estimar la capacidad    de discriminaci&oacute;n de los par&aacute;metros internos para el funcionamiento    de dichos algoritmos se realizaron una serie de experimentos donde se tuvieron    en cuenta los kernels para SVM, las distancias en el caso de kNN y dos RNA (Perceptr&oacute;n    Multicapa, RBF Network). Para esto se utiliz&oacute; un esquema experimental,    validaci&oacute;n cruzada de k particiones (k-fold cross validation). Se realiz&oacute;    un particionamiento de los datos de la forma antes descrita y se realizaron    siete ejecuciones. Se comprobaron los mismos conjuntos de datos para cada clasificador,    tanto en las comparaciones internas de estos algoritmos como en la posterior    comparaci&oacute;n entre los mismos. Para las comparaciones de los resultados    en cada algoritmo, de los conjuntos de datos obtenidos en el particionamiento,    se utilizaron las tres particiones que mejores resultados mostraron en cuanto    a las medidas Pn, &aacute;rea bajo la curva ROC (AUC) y las medias arm&oacute;nicas    <em>H</em> y <em>F</em>. </font>      <P><font size="2" face="Verdana">A trav&eacute;s de una comparaci&oacute;n realizada    por la autora se obtuvieron las caracter&iacute;sticas internas con las cuales    los algoritmos muestran los mejores resultados en la clasificaci&oacute;n de    este tipo de c&eacute;lulas. El algoritmo SVM con el kernel RBF mostr&oacute;    resultados en la clasificaci&oacute;n que se comportan entre un 78% y 86% de    predictividad negativa (Pn) adem&aacute;s de su bajo costo computacional en    comparaci&oacute;n del kernel lineal que mostr&oacute; una Pn entre 79% y 85%    con un elevado costo computacional. En el caso de las redes neuronales comparadas    se evidencia que la RBF Network es m&aacute;s eficiente en el momento de la    clasificaci&oacute;n comport&aacute;ndose entre un 81 y 91% de Pn en comparaci&oacute;n    con la red neuronal MLP que mantuvo un comportamiento entre un 81% y 86%, as&iacute;    como en el caso del algoritmo kNN, la distancia Manhattan evidenci&oacute; obtener    resultados en la clasificaci&oacute;n que se comportan entre un 84 y 93% de    Pn con respecto a la distancia mahalanobis que mostr&oacute; un 84 y 90% de    Pn. Para la selecci&oacute;n de dichas caracter&iacute;sticas se tuvieron en    cuenta adem&aacute;s los valores obtenidos en cuanto a los &iacute;ndices de    efectividad que a continuaci&oacute;n tambi&eacute;n se utilizan en esta investigaci&oacute;n.    Dichos algoritmos arrojaron resultados que demuestran la eficiencia de cada    uno en la clasificaci&oacute;n de las c&eacute;lulas cervicales. </font>     <P><font size="2" face="Verdana">En la presente investigaci&oacute;n se utilizaron,    para evaluar la efectividad de los diferentes clasificadores utilizados, los    &iacute;ndices de efectividad, conocidos como sensibilidad, especificidad, predictividad    positiva y negativa, as&iacute; como la tasa de clasificaci&oacute;n correcta.    Otros &iacute;ndices de efectividad empleados en esta investigaci&oacute;n para    evaluar las distancias en el clasificador fueron el &aacute;rea bajo la curva    ROC, la predictividad negativa y las medidas F y H, dadas por: </font>     ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana"> <img src="/img/revistas/rcim/v8n2/e0108216.jpg" width="468" height="105"></font>      <P>&nbsp;     <P><strong><font size="3" face="Verdana">RESULTADOS Y DISCUSI&Oacute;N</font>    </strong>     <P><font size="2" face="Verdana">A fin de determinar la calidad relativa de los    resultados se realiz&oacute; una comparaci&oacute;n entre los clasificadores    anteriormente mencionados. Se utiliz&oacute; una programaci&oacute;n propia    escrita en lenguaje Java y se utilizaron adem&aacute;s las implementaciones    disponibles en el paquete de Miner&iacute;a de Datos WEKA. </font>     <P><strong><font size="2" face="Verdana"> An&aacute;lisis de los resultados de    acuerdo a la medida F </font> </strong>     <P><font size="2" face="Verdana">El objetivo de este estudio es realizar un an&aacute;lisis    referente al comportamiento del &iacute;ndice de efectividad conocido como medida    o media arm&oacute;nica (-measure, en la literatura en ingl&eacute;s). La media    arm&oacute;nica determina hasta qu&eacute; punto los resultados obtenidos se    asemejan a los que se hubieran logrado con una categorizaci&oacute;n manual    real por cada iteraci&oacute;n de prueba. De acuerdo a los datos ofrecidos en    la <a href="/img/revistas/rcim/v8n2/t0208216.gif">tabla 2</a> se muestra que el valor de la medida    se mantuvo por encima del 86% entre los tres clasificadores donde la media prevaleci&oacute;    por encima del 90%. En la corrida de las iteraciones de prueba el clasificador    kNN obtuvo un 93.4% de medida (mayor valor obtenido). </font>      <P><strong><font size="2" face="Verdana">An&aacute;lisis de los resultados de    acuerdo a la Predictividad Negativa (Pn) </font> </strong>     <P><font size="2" face="Verdana">El objetivo de este estudio es realizar un an&aacute;lisis    referente al comportamiento de la medida de evaluaci&oacute;n predictividad    negativa (Pn). La Pn es la probabilidad de que el clasificador detecte la c&eacute;lula    como normal siendo en realidad el resultado de la prueba diagn&oacute;stica    negativo. De acuerdo a los datos que se ofrecen en la <a href="/img/revistas/rcim/v8n2/t0308216.gif">tabla    3</a> se muestra que el valor de Pn se mantuvo por encima del 73% entre los    tres clasificadores donde la media prevaleci&oacute; por encima del 83%. En    la corrida de las iteraciones de prueba el clasificador kNN obtuvo un 93% de    Pn (mayor valor obtenido). </font>      <P><strong><font size="2" face="Verdana">&Aacute;rea bajo la curva ROC (A-ROC    o AUC) </font> </strong>     <P><font size="2" face="Verdana">El objetivo de este estudio es realizar un an&aacute;lisis    referente al comportamiento de la medida de evaluaci&oacute;n &aacute;rea bajo    la curva ROC (A-ROC o AUC). El AUC seg&uacute;n<sup>14</sup> y <sup>15</sup>,    se define como la probabilidad de clasificar correctamente un par de individuos    (sano y enfermo), seleccionados al azar de la poblaci&oacute;n, mediante los    resultados obtenidos al aplicar la prueba diagn&oacute;stica. Los datos ofrecidos    en la <a href="/img/revistas/rcim/v8n2/t0408216.gif">tabla 4</a> muestran que el valor de la    AUC se mantuvo por encima del 81% entre los tres clasificadores donde la media    prevaleci&oacute; por encima del 91%. En la corrida de las iteraciones de prueba    el clasificador kNN y el RBF Network obtuvieron un 97.1% de AUC (mayor valor    obtenido). En la <a href="/img/revistas/rcim/v8n2/t0408216.gif">tabla 4</a> se muestra la estabilidad    del clasificador kNN por encima de SVM y RBF Network, donde obtuvo los mayores    valores del &aacute;rea bajo la curva ROC en todas las iteraciones de pruebas    realizadas. </font>      ]]></body>
<body><![CDATA[<P><strong><font size="2" face="Verdana"> An&aacute;lisis comparativo de los clasificadores    </font> </strong>     <P><font size="2" face="Verdana">Luego del an&aacute;lisis realizado de acuerdo    a las medidas de evaluaci&oacute;n aplicadas a los clasificadores es necesario    evaluar si existe alguna diferencia significativa que demuestre la superioridad    de un clasificador sobre los dem&aacute;s. Para ello se siguieron las recomendaciones    realizadas por Dem&#154;ar<sup>16</sup> y las extensiones presentadas por Garc&iacute;a    y Herrera.<sup>17</sup> Se procedi&oacute; a realizar un an&aacute;lisis estad&iacute;stico    a trav&eacute;s de pruebas no param&eacute;tricas para k muestras no relacionadas    mediante el Test de Friedman<sup>16</sup> con el objetivo de probar la hip&oacute;tesis    nula de que todos los clasificadores alcanzan los mismos resultados en promedio.    Como pruebas post-hoc se aplic&oacute; primeramente el test Bonferroni-Dunn<sup>16</sup> para definir que existen diferencias significativas entre el clasificador    mejor rankeado y el siguiente. Para contrastar los resultados se aplic&oacute;    el test de Holm.<sup>16</sup> </font>     <P align="center"><img src="/img/revistas/rcim/v8n2/t0508216.gif" width="440" height="405"> <a name="tab5"></a>     <P align="center"><img src="/img/revistas/rcim/v8n2/t0608216.gif" width="423" height="292"> <a name="tab6"></a>     <P align="center"><img src="/img/revistas/rcim/v8n2/t0708216.gif" width="473" height="386"> <a name="tab7"></a>     <P><font size="2" face="Verdana">Las tablas <a href="#tab5">5</a>, <a href="#tab6">6</a>    y <a href="#tab7">7</a> muestran los resultados experimentales de los tres clasificadores    para cada una de las particiones realizadas del conjunto de datos. Las dos &uacute;ltimas    filas muestran el ranking de cada uno de los clasificadores y su posici&oacute;n.    Despu&eacute;s de analizar estad&iacute;sticamente los resultados para detectar    si existen diferencias significativas entre los clasificadores para cada una    de las medidas utilizadas, se comprob&oacute; que el test de Friedman rechaz&oacute;    la hip&oacute;tesis nula para AUC con un valor de y para la medida F con un    valor de , mientras que para Pn no se encontraron diferencias significativas.    Por esta raz&oacute;n solo se aplicaron los test post-hoc para la medida AUC    y medida F. Para ambas medidas los test Bonferroni-Dunn y de Holm rechazaron    la hip&oacute;tesis nula para valores de y respectivamente, con un valor de    confianza (<a href="/img/revistas/rcim/v8n2/t0808216.gif">Tabla 8</a>) y (<a href="/img/revistas/rcim/v8n2/t0908216.gif">Tabla    9</a>). Los resultados presentados en la tabla 8, demuestran que el clasificador    kNN tiene un mejor desempe&ntilde;o que SVM y equivalente que RNA para el particionamiento    realizado de los datos. En el caso de la tabla 9, los resultados presentados    demuestran que el clasificador RNA tiene un mejor desempe&ntilde;o que SVM y    equivalente que kNN para el particionamiento realizado de los datos. </font>      <P><font size="2" face="Verdana">De acuerdo al an&aacute;lisis realizado, se evidencia    que existen diferencias significativas entre los clasificadores kNN y RNA con    respecto a SVM de acuerdo a la medida AUC y a la medida F, no as&iacute; entre    kNN y RNA. Por tal motivo, es necesario realizar un an&aacute;lisis del comportamiento    de los clasificadores kNN y RNA de acuerdo a los valores obtenidos en ambas    medidas en las <a href="/img/revistas/rcim/v8n2/t0208216.gif">tablas 2</a> y <a href="/img/revistas/rcim/v8n2/t0408216.gif">4</a>.    Se evidencia que el mayor valor obtenido en ambas medidas entre ambos clasificadores    fue obtenido por kNN, con un valor de 93.4% en la medida F y del 97.1% para    la medida AUC. </font>      <P><font size="2" face="Verdana">Luego de evaluadas las medidas en cada clasificador,    se evidencia que el clasificador con mejor desempe&ntilde;o en la clasificaci&oacute;n    de c&eacute;lulas cervicales, para el conjunto de datos estudiados, es kNN haciendo    uso de la distancia Manhattan. Dicho clasificador presenta los mejores resultados    para las medidas evaluadas, con valores promedios de medida F de 90.4%, Pn de    83% y AUC de 94.3%. Adem&aacute;s este clasificador mostr&oacute; un alto desempe&ntilde;o    manteniendo los valores de AUC superiores al 91% y llegando hasta un 97.1% (<a href="/img/revistas/rcim/v8n2/t0408216.gif">Tabla    4</a>). Por estas razones se recomienda utilizar el clasificador kNN con la    distancia Manhattan en la herramienta de clasificaci&oacute;n desarrollada.    </font>      <P><strong><font size="2" face="Verdana"> Comparaci&oacute;n con otros enfoques    de la literatura estudiada </font> </strong>     <P><font size="2" face="Verdana">La <a href="/img/revistas/rcim/v8n2/t1008216.gif">tabla 10</a>    muestra la comparaci&oacute;n de la evaluaci&oacute;n estad&iacute;stica obtenida    durante la investigaci&oacute;n con los resultados obtenidos en otras investigaciones    analizadas. Dichas investigaciones utilizan al igual que la presente investigaci&oacute;n    la base de datos Herlev, aunque no especifican la forma en que se realiz&oacute;    la partici&oacute;n de los conjuntos de rasgos para las pruebas y el entrenamiento.    </font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">Se establece una comparaci&oacute;n en funci&oacute;n    de la media arm&oacute;nica debido a que es la medida de evaluaci&oacute;n utilizada    por dichas investigaciones. El resultado obtenido por la presente investigaci&oacute;n    de acuerdo a la media arm&oacute;nica muestra que se logra superar los resultados    obtenidos en,<sup>3</sup> mientras que son ligeramente inferiores a<sup>14</sup>    aunque se debe tener en cuenta que este utiliza un mayor n&uacute;mero de rasgos.    </font>     <P>&nbsp;     <P><font size="3" face="Verdana"><strong>CONCLUSIONES</strong> </font>      <P><font size="2" face="Verdana">Seg&uacute;n,<sup>2</sup> en el a&ntilde;o 2011 se reportaron    en Cuba 1334 casos nuevos de c&aacute;ncer cervicouterino, y unas 455 mujeres    fallecieron por esta causa. Atendiendo a tal situaci&oacute;n, se plantea que    los programas de pesquisa y diagn&oacute;stico precoz del c&aacute;ncer cervicouterino    y sus lesiones precursoras cobran cada vez mayor relevancia. </font>      <P><font size="2" face="Verdana">La presente investigaci&oacute;n se basa fundamentalmente    en la realizaci&oacute;n de una herramienta de clasificaci&oacute;n autom&aacute;tica    que permita la reducci&oacute;n de los falsos negativos resultantes de la clasificaci&oacute;n    de las im&aacute;genes en la prueba de Papanicolaou. A medida que avanz&oacute;    la investigaci&oacute;n y en la realizaci&oacute;n de las pruebas se evidenci&oacute;    que las c&eacute;lulas sanas pertenecientes a la clasificaci&oacute;n Normal_Columnar    de la base de datos Herlev, son c&eacute;lulas propensas a falsos positivos    debido a que sus caracter&iacute;sticas son similares a las pertenecientes a    las c&eacute;lulas enfermas. </font>      <P><font size="2" face="Verdana">A continuaci&oacute;n se enuncian algunos de    los resultados arrojados: </font>     <P><font size="2" face="Verdana">- El empleo de t&eacute;cnicas de clasificaci&oacute;n    en la realizaci&oacute;n de pruebas a c&eacute;lulas cervicales permite obtener    una clasificaci&oacute;n con baja tasa de falsos negativos. </font>      <P><font size="2" face="Verdana">- A trav&eacute;s de una comparaci&oacute;n fueron    obtenidos los par&aacute;metros propios de funcionamiento (kernel, distancias,    n&uacute;meros de clusters) con los cuales los algoritmos muestran los mejores    resultados en la clasificaci&oacute;n de este tipo de c&eacute;lulas. El algoritmo    SVM mostr&oacute; ser m&aacute;s apropiado cuando hace uso del kernel RBF, debido    a su comportamiento con respecto al kernel lineal, y a su bajo costo computacional.    En el caso de las redes neuronales comparadas se evidencia que la RBF Network    es m&aacute;s eficaz en el momento de la clasificaci&oacute;n por los resultados    obtenidos, as&iacute; como en el caso del algoritmo kNN, la distancia Manhattan    evidenci&oacute; obtener mejores resultados adem&aacute;s de un bajo costo computacional.    Dichos algoritmos arrojaron resultados que demuestran su eficacia en la clasificaci&oacute;n    de las c&eacute;lulas cervicales. </font>      <P><font size="2" face="Verdana">- Se demostr&oacute; que a partir de un conjunto    simplificado de datos geom&eacute;tricos b&aacute;sicos, es posible realizar    de forma efectiva la clasificaci&oacute;n binaria de im&aacute;genes en la prueba    de Papanicolaou. </font>      <P><font size="2" face="Verdana">- Los procedimientos estad&iacute;sticos llevados    a cabo por cada &iacute;ndice de efectividad evaluado, determinaron que con    respecto a la medida AUC y a la medida F los clasificadores RNA y kNN pose&iacute;an    diferencias significativas con respecto a SVM, no siendo as&iacute; entre kNN    y RNA para ambas medidas. Luego del an&aacute;lisis estad&iacute;stico kNN mostr&oacute;    un alto desempe&ntilde;o manteniendo los valores de AUC superiores al 91% y    llegando hasta un 97.1%. </font>      ]]></body>
<body><![CDATA[<P><font size="2" face="Verdana">La herramienta de clasificaci&oacute;n desarrollada    como resultado de la presente investigaci&oacute;n, si bien no es una herramienta    de diagn&oacute;stico, sirve como ayuda en el proceso. La misma es capaz de    clasificar entre c&eacute;lulas an&oacute;malas y normales obteniendo resultados    alentadores. Las iteraciones de prueba realizadas y la comparaci&oacute;n de    los resultados obtenidos en otras investigaciones relacionadas con el dominio    abordado demostraron la reducci&oacute;n de falsos negativos que es uno de los    prop&oacute;sitos principales de la presente investigaci&oacute;n. </font>     <P>&nbsp;     <P><strong><font size="3" face="Verdana">REFERENCIAS BIBLIOGR&Aacute;FICAS </font>    </strong>     <!-- ref --><P><font size="2" face="Verdana">1. Lorenzo J.V Rodr&iacute;guez I. Aplicaci&oacute;n    de t&eacute;cnicas de visi&oacute;n computacional en la prueba de Papanicolaou.    Medicentro Electr&oacute;nica. 2012. 16(3): p. 196-198.     </font>      <!-- ref --><P><font size="2" face="Verdana">2. Acosta L.F. El diagn&oacute;stico temprano    es garant&iacute;a de vida. In Peri&oacute;dico Granma. 2012: Ciudad de la Habana.        </font>      <!-- ref --><P><font size="2" face="Verdana">3. Plissiti M, Nikou C. Cervical Cell Classification    Based Exclusively on Nucleus Features. In Image Analysis and Recognition. Campilho    A, Kamel M, Editors. 2012, Springer Berlin Heidelberg. p. 483-490.     </font>      <!-- ref --><P><font size="2" face="Verdana">4. Plissiti M.E, Nikou C. On the importance of    nucleus features in the classification of cervical cells in Pap smear images.    University of Ioannina. 2012.     </font>      <!-- ref --><P><font size="2" face="Verdana">5. Riana D, Murni A. Performance evaluation of    Pap smear cell image classification using quantitative and qualitative features    based on multiple classifiers. In International Conference on Advanced Computer    Science and Information Systems, ACSIS. 2009.     </font>      <!-- ref --><P><font size="2" face="Verdana">6. Mat-Isa N.A, Mashor M.Y, Othman N.H. An automated    cervical pre-cancerous diagnostic system. Artificial Intelligence in Medicine.    2008. 42(1): p. 1-11.     </font>      <!-- ref --><P><font size="2" face="Verdana">7. Huang P.-C, et al. Quantitative Assessment    of Pap Smear Cells by PC-Based Cytopathologic Image Analysis System and Support    Vector Machine, In Medical Biometrics. D. Zhang, Editor. 2007, Springer Berlin    Heidelberg. p. 192-199.     </font>      <!-- ref --><P><font size="2" face="Verdana">8. Marinakis Y, Dounias G, Jantzen J. Pap smear    diagnosis using a hybrid intelligent scheme focusing on genetic algorithm based    feature selection and nearest neighbor classification. Computers in Biology    and Medicine. 2009. 39(1): p. 69-78.     </font>      <!-- ref --><P><font size="2" face="Verdana">9. Plissiti M.E, Nikou C, Charchanti A. Combining    shape, texture and intensity features for cell nuclei extraction in Pap smear    images. Pattern Recognition Letters. 2011. 32(6): p. 838-853.     </font>      <!-- ref --><P><font size="2" face="Verdana">10. Plissiti M.E, et al. Automated Detection    of Cell Nuclei in Pap Smear Images Using Morphological Reconstruction and Clustering.    IEEE Transactions on information technology in biomedicine. 2011. 15(2): p.    233-241.     </font>      <!-- ref --><P><font size="2" face="Verdana">11. Lorenzo J.V, et al. Cervical Cell Classification    Using Features Related to Morphometry and Texture of Nuclei, in Progress in    Pattern Recognition, Image Analysis, Computer Vision, and Applications. 2013,    Springer. p. 222-229.     </font>      <!-- ref --><P><font size="2" face="Verdana">12. Velezmoro G.A.B, Villafuerte D.F. Factores    de riesgo que pron&oacute;stican el hallazgo de citolog&iacute;as cervicales    anormales en dos poblaciones: mujeres de obreros de construcci&oacute;n civil    vs. mujeres control en la posta m&eacute;dica &quot;Construcci&oacute;n Civil&quot;    ESSALUD, de junio a septiembre del 2000, in Facultad de Medicina Humana. 2001,    Universidad Nacional Mayor de San Marcos: Lima, Per&uacute;. p. 67.     </font>      <!-- ref --><P><font size="2" face="Verdana">13. Jantzen J, et al. Pap-smear Benchmark Data    For Pattern Classification. In Proc. NiSIS 2005. 2005, Nature inspired Smart    Information Systems (NiSIS): Albufeira, Portugal. p. 1-9.     </font>      <!-- ref --><P><font size="2" face="Verdana">14. Bamber D. The area above the ordinal dominance    graph and the area below the receiver operating characteristic graph. Journal    of Mathematical Psychology. 1975. 12(4): p. 387-415.     </font>      <!-- ref --><P><font size="2" face="Verdana">15. Hanley J.A, McNei lB.J. The meaning and use    of the area under a receiver operating characteristic (ROC) curve. Radiology.    1982. 143(1): p. 29-36.     </font>      <!-- ref --><P><font size="2" face="Verdana">16. Dem&#154;ar J. Statistical Comparisons of    Classifiers over Multiple Data Sets. The Journal of Machine Learning Research.    2006. 7: p. 1-30.     </font>      <!-- ref --><P><font size="2" face="Verdana">17. Garc&iacute;a S, Herrera F. An Extension    on &quot;Statistical Comparisons of Classifiers over Multiple Data Sets&quot;    for all Pairwise Comparisons. Journal of Machine Learning Research. 2008. 9:    p. 2677-2694.     </font>     <P>&nbsp;     <P>&nbsp;     <P><font size="2" face="Verdana">Recibido: 22 de marzo de 2016.    ]]></body>
<body><![CDATA[<br>   Aprobado: 12 de mayo de 2016.</font>       ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lorenzo]]></surname>
<given-names><![CDATA[J.V]]></given-names>
</name>
<name>
<surname><![CDATA[Rodríguez]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Aplicación de técnicas de visión computacional en la prueba de Papanicolaou]]></article-title>
<source><![CDATA[Medicentro Electrónica]]></source>
<year>2012</year>
<volume>16</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>196-198</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Acosta]]></surname>
<given-names><![CDATA[L.F]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[El diagnóstico temprano es garantía de vida]]></article-title>
<collab>Periódico Granma</collab>
<source><![CDATA[]]></source>
<year>2012</year>
<publisher-loc><![CDATA[Ciudad de la Habana ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Plissiti]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Nikou]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Cervical Cell Classification Based Exclusively on Nucleus Features]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Campilho]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Kamel]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Image Analysis and Recognition]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Plissiti]]></surname>
<given-names><![CDATA[M.E]]></given-names>
</name>
<name>
<surname><![CDATA[Nikou]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[On the importance of nucleus features in the classification of cervical cells in Pap smear images]]></source>
<year>2012</year>
<publisher-name><![CDATA[University of Ioannina.]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Riana]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Murni]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Performance evaluation of Pap smear cell image classification using quantitative and qualitative features based on multiple classifiers]]></source>
<year></year>
<conf-name><![CDATA[ In International Conference on Advanced Computer Science and Information Systems, ACSIS.]]></conf-name>
<conf-date>2009</conf-date>
<conf-loc> </conf-loc>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mat-Isa]]></surname>
<given-names><![CDATA[N.A]]></given-names>
</name>
<name>
<surname><![CDATA[Mashor]]></surname>
<given-names><![CDATA[M.Y]]></given-names>
</name>
<name>
<surname><![CDATA[Othman]]></surname>
<given-names><![CDATA[N.H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An automated cervical pre-cancerous diagnostic system]]></article-title>
<source><![CDATA[Artificial Intelligence in Medicine]]></source>
<year>2008</year>
<volume>42</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1-11</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[P.-C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Quantitative Assessment of Pap Smear Cells by PC-Based Cytopathologic Image Analysis System and Support Vector Machine]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Medical Biometrics]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Marinakis]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Dounias]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Jantzen]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Pap smear diagnosis using a hybrid intelligent scheme focusing on genetic algorithm based feature selection and nearest neighbor classification]]></article-title>
<source><![CDATA[Computers in Biology and Medicine]]></source>
<year>2009</year>
<volume>39</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>69-78</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Plissiti]]></surname>
<given-names><![CDATA[M.E]]></given-names>
</name>
<name>
<surname><![CDATA[Nikou]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Charchanti]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Combining shape, texture and intensity features for cell nuclei extraction in Pap smear images]]></article-title>
<source><![CDATA[Pattern Recognition Letters]]></source>
<year>2011</year>
<volume>32</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>838-853</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Plissiti]]></surname>
<given-names><![CDATA[M.E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Automated Detection of Cell Nuclei in Pap Smear Images Using Morphological Reconstruction and Clustering]]></article-title>
<source><![CDATA[IEEE Transactions on information technology in biomedicine]]></source>
<year>2011</year>
<volume>15</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>233-241</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lorenzo]]></surname>
<given-names><![CDATA[J.V]]></given-names>
</name>
</person-group>
<source><![CDATA[Cervical Cell Classification Using Features Related to Morphometry and Texture of Nuclei, in Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications]]></source>
<year>2013</year>
<page-range>222-229</page-range><publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Velezmoro]]></surname>
<given-names><![CDATA[G.A.B]]></given-names>
</name>
<name>
<surname><![CDATA[Villafuerte]]></surname>
<given-names><![CDATA[D.F]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Factores de riesgo que pronóstican el hallazgo de citologías cervicales anormales en dos poblaciones: mujeres de obreros de construcción civil vs. mujeres control en la posta médica "Construcción Civil" ESSALUD]]></article-title>
<collab>Facultad de Medicina Humana</collab>
<source><![CDATA[]]></source>
<year>2001</year>
<page-range>67</page-range><publisher-loc><![CDATA[Lima ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Nacional Mayor de San Marcos]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jantzen]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Pap-smear Benchmark Data For Pattern Classification]]></source>
<year></year>
<conf-name><![CDATA[ Nature inspired Smart Information Systems (NiSIS)]]></conf-name>
<conf-date>2005</conf-date>
<conf-loc>Albufeira </conf-loc>
</nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bamber]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The area above the ordinal dominance graph and the area below the receiver operating characteristic graph]]></article-title>
<source><![CDATA[Journal of Mathematical Psychology]]></source>
<year>1975</year>
<volume>12</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>387-415</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hanley]]></surname>
<given-names><![CDATA[J.A]]></given-names>
</name>
<name>
<surname><![CDATA[McNei]]></surname>
<given-names><![CDATA[lB.J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The meaning and use of the area under a receiver operating characteristic (ROC) curve]]></article-title>
<source><![CDATA[Radiology]]></source>
<year>1982</year>
<volume>143</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>29-36</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dem&#353;ar]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical Comparisons of Classifiers over Multiple Data Sets]]></article-title>
<source><![CDATA[The Journal of Machine Learning Research]]></source>
<year>2006</year>
<volume>7</volume>
<page-range>1-30</page-range></nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[García]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Herrera]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Extension on "Statistical Comparisons of Classifiers over Multiple Data Sets" for all Pairwise Comparisons]]></article-title>
<source><![CDATA[Journal of Machine Learning Research]]></source>
<year>2008</year>
<volume>9</volume>
<page-range>2677-2694</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
