<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992016000400011</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Una evaluación del algoritmo LVQ en una colección de texto]]></article-title>
<article-title xml:lang="en"><![CDATA[An evaluation of LVQ algorithm in a textual collection]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Guerrero Enamorado]]></surname>
<given-names><![CDATA[Alain]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Ceballos Gastell]]></surname>
<given-names><![CDATA[Daimerys]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas  ]]></institution>
<addr-line><![CDATA[Boyeros La Habana]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2016</year>
</pub-date>
<volume>10</volume>
<numero>4</numero>
<fpage>154</fpage>
<lpage>170</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992016000400011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992016000400011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992016000400011&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN Este trabajo se realizó con el objetivo de obtener información empírica sobre el comportamiento del algoritmo LVQ (Aprendizaje por Cuantificación Vectorial) en la tarea de clasificación de información sobre 24 versiones de una colección de noticias creada previamente, en las cuales se varió la cantidad de términos utilizando el método, Ganancia de Información, para la selección de atributos. Se logra determinar el comportamiento de los algoritmos frente a los efectos de reducción de dimensionalidad. Se encuentra un punto, donde el compromiso entre pérdida de información e incorporación de información irrelevante, logra buenos resultados como promedio entre los distintos algoritmos evaluados.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT The aim of this work was to obtain empirical information on the behavior of the LVQ (Learning Vector Quantization) algorithm in the task of information classification. We developed an algorithm evaluation on 24 versions of a news-collection previously created. In this collection, we varied the number of terms using the method, Information Gain, to select the attributes. The behavior of algorithms against the effects of dimensionality reduction is determined. We found a point, where the compromise between loss of information and incorporation of irrelevant information, has achieved good results.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[aprendizaje por cuantificación vectorial]]></kwd>
<kwd lng="es"><![CDATA[clasificación]]></kwd>
<kwd lng="es"><![CDATA[redes neuronales]]></kwd>
<kwd lng="en"><![CDATA[learning vector quantification]]></kwd>
<kwd lng="en"><![CDATA[classification]]></kwd>
<kwd lng="en"><![CDATA[neural networks]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><strong><font size="4" face="Verdana, Arial, Helvetica, sans-serif">Una evaluaci&oacute;n del algoritmo LVQ en una colecci&oacute;n de  texto</font></strong></p>     <p>&nbsp;</p>     <p><font size="3"><strong><font face="Verdana, Arial, Helvetica, sans-serif">An evaluation of LVQ algorithm in a textual collection</font></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Alain Guerrero Enamorado<strong><sup>1*</sup></strong>, Daimerys Ceballos Gastell<strong><sup>1 </sup></strong></font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Universidad de las Ciencias Inform&aacute;ticas, Carretera  San Antonio, Km 2 &frac12; Torrens, Boyeros. La Habana. Cuba. dceballo@uci.cu </font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span><a href="mailto:rmora@uci.cu"><font size="2">alaing@uci.cu</font></a></font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este trabajo se realiz&oacute; con el  objetivo de obtener informaci&oacute;n emp&iacute;rica sobre el comportamiento del algoritmo  LVQ (Aprendizaje por Cuantificaci&oacute;n Vectorial) en la tarea de clasificaci&oacute;n de  informaci&oacute;n sobre 24 versiones de una colecci&oacute;n de noticias creada previamente,  en las cuales se vari&oacute; la cantidad de t&eacute;rminos utilizando el m&eacute;todo, Ganancia  de Informaci&oacute;n, para la selecci&oacute;n de atributos. Se logra determinar el  comportamiento de los algoritmos frente a los efectos de reducci&oacute;n de  dimensionalidad. Se encuentra un punto, donde el compromiso entre p&eacute;rdida de  informaci&oacute;n e incorporaci&oacute;n de informaci&oacute;n irrelevante, logra buenos resultados  como promedio entre los distintos algoritmos evaluados. </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">aprendizaje por cuantificaci&oacute;n vectorial, clasificaci&oacute;n,  redes neuronales</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">The aim of this work was to obtain empirical information on the  behavior of the LVQ (Learning Vector Quantization) algorithm in the task of  information classification. We developed an algorithm evaluation on 24 versions  of a news-collection previously created. In this collection, we varied the  number of terms using the method, Information Gain, to select the attributes.  The behavior of algorithms against the effects of dimensionality reduction is  determined. We found a point, where the compromise between loss of information  and incorporation of irrelevant information, has achieved good results.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>learning vector  quantification, classification, neural networks</font></p> <hr>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Cuando de clasificar  informaci&oacute;n se trata un m&eacute;todo simple para hacerlo pudiera ser encontrar una  funci&oacute;n lineal que devuelva un valor que represente la membres&iacute;a a una clase  determinada, utilizando para ello como variables de entrada los atributos predictores  del ejemplo que se quiere clasificar. Sin embargo, en los problemas del mundo  real no existen la mayor&iacute;a de las veces funciones lineales capaces de hacer  esto. Cuando esto ocurre, nos encontramos frente a problemas no-lineales donde  una posible soluci&oacute;n puede ser utilizar t&eacute;cnicas de inteligencia artificial  para estimar este tipo de funciones. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este trabajo se  realiza un estudio experimental del algoritmo de clasificaci&oacute;n Aprendizaje por  Cuantificaci&oacute;n Vectorial (LVQ) propuesto por Tuevo Kohonen en el trabajo (Kohonen 1988).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con este trabajo se  persigue como objetivo fundamental realizar una evaluaci&oacute;n del LVQ sobre 24  versiones distintas de una colecci&oacute;n textual construida por los autores con  noticias en ingl&eacute;s tomadas de medios de prensa y clasificadas en las  categor&iacute;as: cultura, econom&iacute;a, ciencia-y-tecnolog&iacute;a y deportes. Las 24  versiones se crearon a partir de aplicar el m&eacute;todo de ganancia de informaci&oacute;n  para reducir la dimensionalidad de la colecci&oacute;n original de 21731 t&eacute;rminos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la secci&oacute;n 0 se detalla el algoritmo en sus  principales versiones, posteriormente se exponen las principales  caracter&iacute;sticas del resto de los algoritmos utilizados para la experimentaci&oacute;n.  El algoritmo LVQ tambi&eacute;n puede entrenarse sin clases de salida utilizando un aprendizaje  no-supervisado para aplicarlo en la tarea de agrupamiento. Desde hace algunos  a&ntilde;os atr&aacute;s, como se vislumbra en los art&iacute;culos (Bezdek &amp; Pal 1995; Karayiannis &amp; Pai 1996;  Karayiannis 1997; Karayiannis 1999; Pal et al. 1993) pueden  encontrarse este tipo de aplicaciones que no se tratan aqu&iacute;. Sin embargo, el &aacute;mbito  del presente trabajo es b&aacute;sicamente la aplicaci&oacute;n del LVQ solamente en la tarea  de clasificaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo LVQ ha sido y sigue siendo sometido a una gran cantidad de  investigaciones por parte de la comunidad cient&iacute;fica internacional. Algunas de  las extensiones que se le han realizado, toman como punto de partida la  sustituci&oacute;n de la medida de distancia por m&eacute;tricas m&aacute;s generales tales como:  medida euclidiana pesada (Hammer &amp; Villmann 2002), matriz de relevancia adaptativa (Schneider et al. 2009), m&eacute;trica pseudo-euclidiana (Hammer et al. 2011) y m&eacute;tricas en el espacio del n&uacute;cleo caracter&iacute;stico (Qin &amp; Suganthan 2004). Muchas tambi&eacute;n han sido las aplicaciones del LVQ en varios campos como  por ejemplo: en el procesamiento de se&ntilde;ales e im&aacute;genes (Bashyal &amp; Venayagamoorthy 2008; Blume  &amp; Ballard 2007), en la  industria (Ahn &amp; Nguyen 2007; Bassiuny et al.  2007), en la  medicina (Anagnostopoulos et al. 2001; Chen 2012;  Dieterle et al. 2003; Dutta et al. 2001) y muchos otros. Una lista m&aacute;s exhaustiva puede encontrarse en l&iacute;nea en la  base de datos (Neural Networks Research Centre 2007). Como se puede constatar muchas han sido las investigaciones realizadas  por la comunidad cient&iacute;fica sobre el algoritmo LVQ, motivo por el cual los  autores se motivaron a realizar una evaluaci&oacute;n del mismo para una colecci&oacute;n de noticias  como posible aplicaci&oacute;n en la clasificaci&oacute;n de texto. En la secci&oacute;n 0 se  mencionan las herramientas y m&eacute;todos. Finalmente en la secci&oacute;n 0 se exponen  los resultados obtenidos y se dan algunas recomendaciones para la continuidad  de este trabajo.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>MATERIALES Y M&Eacute;TODOS </B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En esta secci&oacute;n se  detallan los algoritmos empleados en los diferentes experimentos realizados,  partiendo de la explicaci&oacute;n detallada del algoritmo LVQ en sus variantes  fundamentales y exponiendo las principales caracter&iacute;sticas del resto de los  algoritmos utilizados para la experimentaci&oacute;n.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Aprendizaje  por cuantificaci&oacute;n vectorial (LVQ)</strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tuevo Kohonen present&oacute;  un modelo de red neuronal (Kohonen 1988) con capacidad  para formar mapas de caracter&iacute;sticas de manera similar a como ocurre en el  cerebro. Este modelo parte de dos variantes: el aprendizaje por cuantificaci&oacute;n  vectorial (LVQ, Learning Vector Quantization) y los mapas auto-organizados  (SOM, Self Organizing Map). En ambos casos se construyen mapas topol&oacute;gicos  donde son agrupadas de cierta manera las entidades con caracter&iacute;sticas  similares. Ambos algoritmos utilizan un aprendizaje competitivo reforzado,  distingui&eacute;ndose una etapa de entrenamiento y otra de explotaci&oacute;n (Kohonen 1990; Kohonen 2001). Una de las  principales diferencias que existen entre el algoritmo LVQ y su precursor SOM  radica en que este &uacute;ltimo agrupa las instancias de acuerdo a su similitud,  mientras que en el primero una vez que fueron agrupadas se les asigna adem&aacute;s  una clase. Esta &uacute;ltima caracter&iacute;stica del LVQ es la que permite que sea  utilizado en la tarea de clasificaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El modelo LVQ utiliza  una red de dos capas como el mostrado en la <a href="#f01">Figura  1</a>, sus conexiones se realizan hacia  delante. Los pesos de conexi&oacute;n se representan mediante una matriz de pesos W seg&uacute;n cada capa de la red neuronal.</font></p>     <div align="center"><img src="/img/revistas/rcci/v10n4/f0111416.jpg" alt="f01" width="380" height="201"><a name="f01"></a><br clear="all"> </div>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El proceso de entrenamiento comienza con la  inicializaci&oacute;n de los pesos sin&aacute;pticos. Dicha inicializaci&oacute;n se puede realizar  de varias formas, entre ellas est&aacute;n: pesos nulos, pesos aleatorios de peque&ntilde;o  valor absoluto, o pesos con un valor de partida predefinido. Luego se escoge  una instancia del conjunto de entrenamiento y se presenta a la entrada de la  red. Cada vector prototipo (vector fila de la matriz de pesos W<sup>1</sup>, o  vector formado con el conjuntos de todos los pesos que unen cada atributo de  entrada con una neurona en particular de esta capa competitiva), de la capa  competitiva calcula su distancia con respecto al vector de entrada en base a  alguna funci&oacute;n de similitud, como por ejemplo: producto interno, funci&oacute;n  coseno, distancia <em>hamming</em>, distancia  euclidiana, etc. El criterio de medida utilizado en este trabajo fue la  distancia euclidiana definida por la ecuaci&oacute;n (1).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo0111416.jpg" alt="fo01" width="315" height="46"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Despu&eacute;s  se establece una competici&oacute;n entre los vectores prototipos y el vector de  entrada para determinar cu&aacute;l es el m&aacute;s cercano al vector de entrenamiento el  cual ser&aacute; proclamado ganador de dicha competici&oacute;n, es decir, se determina la  neurona ganadora, cuya distancia sea la menor de todas. As&iacute; la salida de la  primera capa de la red LVQ se define por la ecuaci&oacute;n (2).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo0211416.jpg" alt="fo02" width="413" height="36"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde a<sup>1</sup> es la salida  y n<sup>1</sup> es la  entrada neta a la funci&oacute;n de transferencia, definida por la ecuaci&oacute;n (3).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo0311416.jpg" alt="fo03" width="282" height="95"></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La funci&oacute;n Compet(.)&nbsp;es una funci&oacute;n de transferencia que  encuentra el &iacute;ndice i-&eacute;simo de la neurona con la entrada neta con mayor  similitud con la entrada actual y fija su salida en uno, el resto de las  neuronas devuelven como salida cero (McClelland et al.  1987). Dicho de otra forma, la neurona cuyo vector de pesos  est&eacute; m&aacute;s cercano al vector de entrada tendr&aacute; salida 1 y el resto de las  neuronas tendr&aacute;n salida 0; la salida no cero representa una sub-clase, muchas  neuronas (subclases), conforman una clase. La segunda capa de la red LVQ es  usada para combinar varias subclases dentro de una sola clase, esto es  realizado por la matriz de pesos W<sup>2 </sup>.Las columnas  de W<sup>2</sup></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">&nbsp;representan las subclases y las filas  representan las clases, W<sup>2</sup> tiene un  solo 1 en cada columna, todos los dem&aacute;s elementos son cero, la fila de la  columna en la cual se presenta el 1 &iacute;ndica cu&aacute;l es la clase a la que la  subclase pertenece.</font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> Dicho de  otra forma si <img src="/img/revistas/rcci/v10n4/fo0411416.jpg" alt="fo04" width="25" height="24"> = 1; entonces  la subclase i pertenece a la clase k.  Una propiedad importante de esta red, es que el proceso de combinar subclases  para formar clases, permite la creaci&oacute;n de clases m&aacute;s complejas. Una sola capa  competitiva est&aacute;ndar tiene la limitaci&oacute;n de que puede crear solo regiones de  decisi&oacute;n convexas; la red LVQ soluciona esta limitaci&oacute;n (Kohonen 2001).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para generar  la matriz W<sup>2</sup> , antes de que  se inicie el aprendizaje, cada neurona en la segunda capa es asignada a una  neurona de salida; por lo general igual n&uacute;mero de neuronas ocultas son conectadas  a cada neurona de salida, para que cada clase pueda ser conformada por el mismo  n&uacute;mero de regiones convexas. Una vez que ha sido definida nunca ser&aacute; alterada  durante el proceso de entrenamiento que solo modificar&aacute; los pesos de W<sup>1</sup>. Para obtener  la salida final se calcula a<sup>2</sup>=W<sup>2 </sup>* a<sup>1</sup> que indicar&aacute;  a quien est&aacute; siendo asignado el vector de entrada P presentado  inicialmente a la red. Se procede entonces a la actualizaci&oacute;n de los pesos  sin&aacute;pticos de la neurona ganadora por medio de la regla de Kohonen (Kohonen 1990) que es empleada para mejorar solo la capa oculta de  la red LVQ.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Puesto que  los vectores prototipos y los patrones de entradas est&aacute;n etiquetados con las  clases a las que pertenecen, las correcciones son del tipo premio o castigo. Si  se acert&oacute; en la clasificaci&oacute;n (la clase del vector prototipo ganador y la clase  del vector de entrada coinciden) se premia al vector prototipo acerc&aacute;ndolo a&uacute;n  m&aacute;s al vector de entrada. Por el contrario, si la clasificaci&oacute;n no se ha  realizado correctamente (la clase seleccionada por el vector prototipo ganador es  diferente a la clase del vector de entrada), se castiga al vector prototipo  alej&aacute;ndolo del vector de entrada. La actualizaci&oacute;n de los pesos para el  instante t + 1 se realiza seg&uacute;n la ecuaci&oacute;n (4).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo0511416.jpg" alt="fo05" width="461" height="32"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde a(t) es  la tasa de aprendizaje, la misma se utiliza de tres formas posibles en la  ecuaci&oacute;n (4):</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">a(t) con signo positivo si <img src="/img/revistas/rcci/v10n4/fo0611416.jpg" alt="fo06" width="88" height="24"> pertenecen a la misma clase, en este  caso se premia la neurona ganadora.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">a(t)</font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">con signo negativo si <img src="/img/revistas/rcci/v10n4/fo0611416.jpg" alt="fo06" width="88" height="24"> pertenecen a clases diferentes, en este  caso se castiga la neurona ganadora</font></p>   </li>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">a(t) = 0, es decir <img src="/img/revistas/rcci/v10n4/fo0711416.jpg" alt="fo07" width="127" height="24">, para el caso de cualquier otro vector prototipo <img src="/img/revistas/rcci/v10n4/fo0811416.jpg" alt="fo08" width="44" height="23"> distinto  del ganador. </font></p>   </li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este par&aacute;metro a(t) o tasa de aprendizaje es utilizado por muchas redes  neuronales en su fase de entrenamiento para controlar la velocidad de  convergencia de los pesos sin&aacute;pticos. Resulta de gran importancia la elecci&oacute;n  de un valor adecuado para la tasa de aprendizaje que permita hallar un punto de  equilibrio entre la velocidad de convergencia y la estabilidad final de los  vectores prototipo. Una a(t) cercana a <em>0</em>,  hace que el aprendizaje sea lento pero asegura que cuando un vector prototipo  haya alcanzado una clase se mantenga all&iacute; indefinidamente; sin embargo valores  altos de a(t) (cercanos a <em>1</em>) hacen que el acercamiento del vector prototipo al  vector de entrada sea muy r&aacute;pido, pero tiene como desventaja que los pesos  tendr&aacute;n grandes oscilaciones provocando muchas veces inestabilidad en el  proceso de convergencia. Otra posibilidad es utilizar un a(t) adaptativo, se  inicializa con alg&uacute;n valor no muy alto, por ejemplo <em>0.3</em>; y se decrementa a medida que avanza el entrenamiento seg&uacute;n  alguna funci&oacute;n, de manera que al final del proceso su valor sea muy cercano a <em>0</em>. Normalmente, por motivos  computacionales, se suele elegir una funci&oacute;n lineal, mon&oacute;tona decreciente y que  tome valores en el intervalo (<em>0; 1</em>). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Kohonen y sus colaboradores han desarrollado diferentes versiones del  algoritmo inicial LVQ, en este trabajo se utilizan las versiones LVQ1, LVQ2.1 y  LVQ3 implementaciones disponibles en la herramienta para miner&iacute;a de datos KEEL (Alcal&aacute;-Fdez et al. 2008) (<em>Knowledge  Extraction based on Evolutionary Learning</em>). </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Variante  LVQ 2.1 </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El cambio fundamental respecto al algoritmo original radica en la forma de  actualizar los pesos. En esta versi&oacute;n en lugar de seleccionar un &uacute;nico vector  prototipo ganador son seleccionados los dos </font><img src="/img/revistas/rcci/v10n4/fo0911416.jpg" alt="fo09" width="73" height="23"> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">m&aacute;s pr&oacute;ximos al vector de entrada (X), pero con la condici&oacute;n  que uno de ellos pertenezca a la clase del vector de entrada y el otro no. Adem&aacute;s,  el vector de entrada debe quedar situado cercano al punto medio de la ventana  que se forma entre estos dos vectores prototipo. Definiendo: </font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">s como el ancho de la ventana (valores recomendados  entre 0.2 y 0.3) y</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">d<sub>i</sub> y d<sub>j</sub> distancias euclidianas desde el vector de entrada  hasta cada uno de los vectores prototipo ganadores. </font></p>   </li>     ]]></body>
<body><![CDATA[</ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se  dice que este vector se encuentra dentro de la ventana si satisface la ecuaci&oacute;n  (5). </font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo1011416.jpg" alt="fo10" width="259" height="45"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En esta versi&oacute;n las ecuaciones de  actualizaci&oacute;n de los pesos quedan como en 6 y 7.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo1111416.jpg" alt="fo11" width="436" height="56"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con  esta variante del algoritmo se logra un efecto doble puesto que en cada  iteraci&oacute;n se premia al mejor vector prototipo que pertenece a la misma clase  que el vector de entrada al mismo tiempo que se castiga al vector prototipo m&aacute;s  cercano que pertenece a una clase distinta a la del vector de entrada.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Variante LVQ 3 </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En esta nueva versi&oacute;n se realiza una combinaci&oacute;n entre las dos variantes  anteriores LVQ 1 y LVQ 2.1. Al igual que en la versi&oacute;n anterior son  seleccionados los dos vectores prototipo </font><img src="/img/revistas/rcci/v10n4/fo0911416.jpg" alt="fo09" width="73" height="23"> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">m&aacute;s pr&oacute;ximos al vector de entrada (X). Ahora si <img src="/img/revistas/rcci/v10n4/fo1211416.jpg" alt="fo12" width="30" height="24"> pertenece a la clase del vector de entrada y <img src="/img/revistas/rcci/v10n4/fo1311416.jpg" alt="fo13" width="27" height="26"> no pertenece a la misma clase que X, y adem&aacute;s ambos quedan  definidos en la ventana como en el LVQ 2.1 las modificaciones a los pesos  sin&aacute;pticos se realizan exactamente igual a como se definieron por las  ecuaciones 6 y 7. Pero si por el contrario ambos vectores prototipo pertenecen  a la misma clase que X &nbsp;entonces ambos son premiados seg&uacute;n las  siguientes dos nuevas ecuaciones 8 y 9.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo1411416.jpg" alt="fo14" width="463" height="70"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde <img src="/img/revistas/rcci/v10n4/fo1511416.jpg" alt="fo15" width="12" height="16"> toma  valores en el intervalo [0.1; 0.5].</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Trabajos relacionados</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En  este trabajo se hace una comparaci&oacute;n del algoritmo LVQ frente a cuatro t&eacute;cnicas  de las m&aacute;s reconocidas por la comunidad cient&iacute;fica (Wu et al. 2007). En particular se realiza la comparaci&oacute;n contra los  algoritmos: &aacute;rboles de decisi&oacute;n C4.5 (Quinlan 1993), Bayesiano Ingenuo o NB (Domingos &amp;  Pazzani 1997; John &amp; Langley 1995; Maron 1961), K-vecinos m&aacute;s cercanos o KNN (Fix &amp; Hodges  1951; Cover et al. 1967; Wang et al. 2007) y las M&aacute;quinas de Soporte Vectorial o SVM (Cortes et al. 1995). En todos los casos se utilizaron las  implementaciones de los algoritmos presentes en la herramienta KEEL (Alcal&aacute;-Fdez et al.  2008).</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">LVQ1 optimizado (OLVQ1) </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Entre muchas variantes del LVQ, est&aacute; el caso del  OLVQ1, este utiliza la misma ecuaci&oacute;n 4 para actualizar los pesos <img src="/img/revistas/rcci/v10n4/fo1211416.jpg" alt="fo12" width="30" height="24"> pero en  lugar de utilizar un a(t) constante se  utiliza un a<sub>i</sub>(t) variable en  el tiempo. De esta manera si <img src="/img/revistas/rcci/v10n4/fo1211416.jpg" alt="fo12" width="30" height="24">(t) y P(t) pertenecen a  la misma clase se utiliza la ecuaci&oacute;n 10 para actualizar a<sub>i</sub>(t). En cambio si <img src="/img/revistas/rcci/v10n4/fo1211416.jpg" alt="fo12" width="30" height="24">(t) y P(t) pertenecen a  clases diferentes se utiliza la ecuaci&oacute;n 11 para actualizar a<sub>i</sub>(t). En caso de  que se trate de un vector prototipo </font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif"><img src="/img/revistas/rcci/v10n4/fo1211416.jpg" alt="fo12" width="30" height="24">(t) distinto del ganador se mantiene constante a<sub>i</sub>(t + 1) = a<sub>i</sub>(t).</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo1611416.jpg" alt="fo16" width="416" height="87"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Sin  embargo, hasta el momento la herramienta KEEL no dispone de la implementaci&oacute;n  del OLVQ1, por lo que se deja para futuros trabajos la posibilidad de extender  el KEEL con su implementaci&oacute;n para as&iacute; incluir y enriquecer a&uacute;n m&aacute;s la  evaluaci&oacute;n experimental del algoritmo LVQ de este art&iacute;culo.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En  la bibliograf&iacute;a no existen muchas referencias sobre cual algoritmo escoger para  un problema en cuesti&oacute;n, el mismo Kohonen sostiene que las cuatro variantes dan  resultados muy similares (Kohonen 2001). Sin embargo en el &aacute;mbito de este trabajo se  obtienen algunas diferencias en el comportamiento de las distintas versiones  las cuales se discuten en las pr&oacute;ximas secciones 0  y 0.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>&Aacute;rboles  de decisi&oacute;n (C4.5) </strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este  algoritmo genera reglas de clasificaci&oacute;n en forma de &aacute;rboles de decisi&oacute;n  partiendo de un conjunto de entrenamiento, dicho &aacute;rbol se construye de arriba  hacia abajo y en cada paso de ejecuci&oacute;n del algoritmo se realiza una prueba en  cada nodo (partiendo del nodo ra&iacute;z) para determinar cu&aacute;l separa mejor los  ejemplos de la colecci&oacute;n de acuerdo a la clase a la que pertenecen. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este  algoritmo surgi&oacute; inicialmente como una mejora al ID3 (Quinlan 1986) para permitir informaci&oacute;n incompleta o valores  omitidos en los datos, adem&aacute;s maneja atributos continuos, utiliza una m&eacute;trica  para la selecci&oacute;n de los atributos que maximiza la ganancia de informaci&oacute;n y  finalmente poda el resultado partiendo del principio de m&iacute;nima longitud de  descripci&oacute;n o principio MDL (Rissanen 1978).</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se puede configurar en KEEL con los siguientes  par&aacute;metros:</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Prune</em>: este par&aacute;metro permite activar o desactivar el  mecanismo de poda de los &aacute;rboles.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Confidence</em>: define el nivel m&iacute;nimo de confianza que debe tener  una hoja para mantenerse dentro del &aacute;rbol.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>minItemsets</em>: define el n&uacute;mero m&iacute;nimo de instancias por hojas.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Bayesiano  Ingenuo (NB)</font></p>   </li>     </ul>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este  algoritmo se basa en la aplicaci&oacute;n del teorema de probabilidad condicional de  Bayes (Bayes 1763), al mismo tiempo que se asume independencia entre  los atributos predictores para poderse aplicar dicho teorema. El algoritmo  calcula la probabilidad condicional de cada ejemplo pertenecer a cada clase,  entonces se asigna como clase de un nuevo ejemplo la de mayor probabilidad  condicional calculada anteriormente. Este tipo de clasificador a pesar de su  sencillez ha demostrado comportarse muy bien en muchos problemas incluso aun  cuando no se cumple la asunci&oacute;n de independencia de los atributos de entrada.    <br>   Este  modelo se puede configurar en KEEL sin ning&uacute;n par&aacute;metro, aunque la  implementaci&oacute;n solo permite atributos nominales, por lo cual se utiliz&oacute;  previamente en las colecciones num&eacute;ricas una discretizaci&oacute;n de frecuencia  uniforme (Liu et al. 2002) con 10 intervalos. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>K-vecinos  m&aacute;s cercanos (KNN) </strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">M&eacute;todo de clasificaci&oacute;n supervisada que permite  estimar una funci&oacute;n de clasificaci&oacute;n partiendo de los atributos predictores. La  informaci&oacute;n para estimar la funci&oacute;n se obtiene del conjunto de los <em>k</em> vecinos m&aacute;s cercanos. Cada ejemplo de  la colecci&oacute;n es un punto en un espacio multidimensional de los atributos  descriptores. Utilizando una medida de distancia se estima cuan cerca se encuentra  el ejemplo actual del resto, tomando entonces las clases a las que pertenecen  los <em>k</em> m&aacute;s cercanos se tiene un voto  para asignar la clase del ejemplo en cuesti&oacute;n. Se utiliza generalmente la  distancia euclidiana. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este modelo se puede configurar en KEEL con los  siguientes par&aacute;metros:</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>k</em>: n&uacute;mero de vecinos a encuestar.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Distance  function</em>: se implementan 3  posibilidades en KEEL:</font></p>   </li>   <ul>         <li>           ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Euclidean</em>:  con atributos normalizados.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Heterogeneous  Value Difference Metric</em> o HVDM (Wilson &amp;  Martinez 2000):  esta utiliza la distancia euclidiana para atributos num&eacute;ricos y la VDM (Stanfill &amp; Waltz  1986)  para atributos nominales.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Manhattan</em>: la distancia entre dos puntos es el valor absoluto  de la suma de las diferencias de las coordenadas de estos.</font></p>     </li>       </ul>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>M&aacute;quinas de Soporte Vectorial  (SVM)</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Realiza  la tarea de clasificaci&oacute;n por medio de encontrar un hiperplano que maximiza el  margen entre dos clases. Los vectores (ejemplos de la colecci&oacute;n) que definen el  hiperplano son los vectores de soporte. El algoritmo inicia con definir un  hiperplano &oacute;ptimo que maximice el margen, entonces los datos son mapeados a un  espacio de mayor dimensi&oacute;n, por medio de una funci&oacute;n de <em>kernel</em>, donde es m&aacute;s f&aacute;cil encontrar superficies de decisi&oacute;n  lineales. En el caso ideal este algoritmo logra generar un hiperplano que  separa completamente las clases sin solapamiento. No obstante, el caso ideal  casi nunca se logra quedando un ligero solapamiento entre las clases que se  traduce en errores de clasificaci&oacute;n. Por lo anterior el algoritmo lo que busca  es encontrar el hiperplano que maximiza el margen y minimiza los errores de clasificaci&oacute;n.  Para el caso multi-clase SVM utiliza un esquema de votaci&oacute;n.    <br>   Este modelo se puede configurar en KEEL con los  siguientes par&aacute;metros:</font></p>  <ul>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>KernellType</em>: funci&oacute;n de <em>kernel</em> a utilizar para transformar los datos.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>C</em>: par&aacute;metro que define el costo del error de  clasificaci&oacute;n.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Degree</em>: grados de libertad de la funci&oacute;n de <em>kernel</em>.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Gamma</em>: par&aacute;metro gamma de la funci&oacute;n de <em>kernel</em>.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Coef0</em>: par&aacute;metro <em>coef0</em> en la funci&oacute;n de <em>kernel</em>.</font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>Shrinking</em>: reduce el tama&ntilde;o del problema de optimizaci&oacute;n dejando  de considerar algunas de las variables.</font></p>   </li>     </ul>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>RESULTADOS Y DISCUSI&Oacute;N </B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En  esta secci&oacute;n se presentan los resultados emp&iacute;ricos del proceso de evaluaci&oacute;n de  los algoritmos. Fue utilizada la exactitud predictiva como m&eacute;trica para la  evaluaci&oacute;n del desempe&ntilde;o de todos los algoritmos involucrados.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Colecci&oacute;n de noticias.</strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se construy&oacute; una colecci&oacute;n de entrenamiento de  textos en ingl&eacute;s compuesta por documentos de noticias de prensa, extra&iacute;das de  los siguientes medios: </font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Granma,  disponible en: <a href="http://www.granma.cu/">http://www.granma.cu/</a> </font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Juventud Rebelde,  disponible en: <a href="http://www.juventudrebelde.cu/">http://www.juventudrebelde.cu/</a> </font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Agencia Cubana  de noticias (ACN), disponible en: <a href="http://www.cubanews.ain.cu/">http://www.cubanews.ain.cu/</a> </font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Prensa Latina, disponible en: <a href="http://www.prensa-latinaenglish.com/">http://www.prensa-latinaenglish.com/</a> </font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Cubarte, disponible en: <a href="http://www.cubarte-english.cult.cu/">http://www.cubarte-english.cult.cu/</a> </font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CNN, disponible en: <a href="http://edition.cnn.com/">http://edition.cnn.com/</a> </font></p>   </li>     ]]></body>
<body><![CDATA[</ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para representar los documentos se utiliz&oacute; el Modelo  de Espacio Vectorial (MEV) (Salton et al. 1975), pero antes de construirlo, todos los documentos  fueron pre-procesados. Para ello se convirtieron todas las may&uacute;sculas a  min&uacute;sculas, se eliminaron los n&uacute;meros, se aplic&oacute; un filtro para reducir la  cantidad de letras consecutivas repetidas m&aacute;s de tres veces en una palabra, se  eliminaron las palabras vac&iacute;as que se encuentran en la lista de parada del  sistema de recuperaci&oacute;n de informaci&oacute;n SMART. Tambi&eacute;n se  eliminaron las 1000 palabras m&aacute;s frecuentes del idioma ingl&eacute;s</font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> debido a que  estas palabras tienen una gran probabilidad de aparecer en casi todos los  documentos y har&iacute;a el&nbsp;idf (<em>inverse  document frequency</em>) muy cercano a cero haciendo que la representaci&oacute;n de  esos t&eacute;rminos en el espacio vectorial igual a cero. Luego, a cada t&eacute;rmino se le  aplic&oacute; la funci&oacute;n de <em>stemming</em> de  Porter ampliamente  utilizada, que permite extraer los sufijos y prefijos comunes de palabras  literalmente diferentes pero con una ra&iacute;z com&uacute;n que pueden ser consideradas  como un s&oacute;lo t&eacute;rmino. Tras este proceso se obtuvieron un total de <em>21731</em> palabras.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el MEV  cada documento se representa mediante un vector de t&eacute;rminos. Cada t&eacute;rmino lleva  asociado un coeficiente o peso que trata de expresar la importancia o grado de  representatividad de ese t&eacute;rmino en ese vector o documento. De esta manera, un  conjunto de m documentos y de n&nbsp;t&eacute;rminos ser&iacute;a una matriz de n&nbsp;filas por m&nbsp;columnas. El valor de cada  componente del vector representa la importancia relativa de ese t&eacute;rmino en el  documento. Una aproximaci&oacute;n com&uacute;n para el pesado de t&eacute;rminos usa la frecuencia  de ocurrencia de una palabra determinada en el documento para representar las  componentes del vector. Para calcular los pesos de los t&eacute;rminos se usa la  ecuaci&oacute;n est&aacute;ndar tf * idf, donde tf (<em>term frequency</em>) identifica la frecuencia del t&eacute;rmino en el documento, y&nbsp; idf (<em>inverse document frequency</em>) es el  inverso de la frecuencia del documento definida en la ecuaci&oacute;n 12.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/fo1711416.jpg" alt="fo17" width="232" height="39"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde la  frecuencia del documento df<sub>i</sub> identifica  al n&uacute;mero de documentos de la colecci&oacute;n en el que se encuentra presente el  t&eacute;rmino y M&nbsp;es el n&uacute;mero total de documentos en la  colecci&oacute;n. Finalmente se cre&oacute; una colecci&oacute;n con 800 documentos, 21 731 t&eacute;rminos  y 4 clases distintas con 200 documentos por cada una.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para  obtener las 24 versiones distintas partiendo de la colecci&oacute;n anterior, se  aplic&oacute; desde la herramienta Weka (Hall et al. 2009) un filtro supervisado de selecci&oacute;n de atributos en  el que se utiliz&oacute; el m&eacute;todo de ganancia de informaci&oacute;n para reducir la  dimensionalidad de la colecci&oacute;n original. Seleccion&aacute;ndose: 20, 40, 60, 80, 100,  200, 300, 400, 500, 600, 700, 800, 900,1000, 1100, 1200, 1300, 1400, 1500,  1600, 1700, 1800, 1900 y 2000 t&eacute;rminos. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Herramientas  utilizadas en la experimentaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se ejecutaron todas las simulaciones con la  herramienta KEEL (Alcal&aacute;-Fdez et al.  2011),  los experimentos se ejecutaron en un procesador Dual Core AMD-300 a 1.3GHz, 4GB  de memoria RAM y Sistema Operativo Windows 8. En general se utilizaron las  configuraciones por defecto de KEEL excepto en el caso del algoritmo KNN en el  cual se utiliz&oacute; k = 5 y en los algoritmos LVQ donde se utilizaron una cantidad  de iteraciones de 500 en lugar de 100. Las configuraciones de cada caso se  pueden consultar en la <a href="#t01">Tabla 1</a>.</font></p>     <p align="center"><img src="/img/revistas/rcci/v10n4/t0111416.jpg" alt="t01" width="531" height="386"><a name="t01"></a></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Resultados  experimentales</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para  la experimentaci&oacute;n se utiliz&oacute; el procedimiento de validaci&oacute;n cruzada con 10&nbsp;particiones y adem&aacute;s 5&nbsp;ejecuciones con semillas aleatorias distintas  cada vez, para un total de 50&nbsp;experimentos (en cada par  algoritmo-colecci&oacute;n), los resultados de la m&eacute;trica exactitud predictiva  (cantidad de ejemplos clasificados correctamente sobre el total de ejemplos)  fueron promediados para medir la competitividad de cada algoritmo en cada  colecci&oacute;n de datos. El experimento se dise&ntilde;&oacute; para escoger una m&iacute;nima cantidad  de t&eacute;rminos que permitieran reducir la dimensionalidad de la colecci&oacute;n de  noticias creada inicialmente como se describi&oacute; en la secci&oacute;n 0.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tras  la ejecuci&oacute;n de los 7 algoritmos (LVQ1, LVQ2.1, LVQ3, SVM, C45, KNN&nbsp;&nbsp;&nbsp;&nbsp; y NB) en las 24 versiones de la colecci&oacute;n  de datos de noticias podemos mostrar los resultados obtenidos en la <a href="/img/revistas/rcci/v10n4/t0211416.jpg" target="_blank">Tabla 2</a>&nbsp;en valor porcentual  de la exactitud predictiva. En la misma por razones de espacio solo se  colocaron en la primera columna de la izquierda la cantidad de t&eacute;rminos que  define la versi&oacute;n de la colecci&oacute;n de noticias utilizada en ese caso y se a&ntilde;adi&oacute;  una columna adicional al final con el promedio entre todos los algoritmos con  el fin de delimitar la cantidad de t&eacute;rminos m&iacute;nimos necesarios para lograr una  correcta clasificaci&oacute;n en la colecci&oacute;n de noticias. La zona donde se obtienen  los mejores resultados de clasificaci&oacute;n como promedio se encuentra entre los  400 y los 900 t&eacute;rminos, y el primer punto donde se logran los mejores  resultados es en el valor de 600 t&eacute;rminos donde se alcanza un promedio de 89.1%. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="/img/revistas/rcci/v10n4/f0211416.jpg" target="_blank">Figura 2</a>  se grafican los valores antes representados en la <a href="/img/revistas/rcci/v10n4/t0211416.jpg" target="_blank">Tabla 2</a> &nbsp;para visualizar mejor, c&oacute;mo el comportamiento  de la mayor&iacute;a de los algoritmos se mantiene estable a partir de cierta cantidad  de t&eacute;rminos sin grandes incrementos en la exactitud predictiva. Sin embargo, en  los casos de los algoritmos KNN y LVQ3 y en menor medida del LVQ2.1 se empeora  el resultado con el incremento de la cantidad de t&eacute;rminos en la colecci&oacute;n. En  la Figura 2  se ha delimitado la regi&oacute;n de mejores resultados (valores muy pr&oacute;ximos a 0.90)  con dos l&iacute;neas discontinuas verticales de color azul. La l&iacute;nea roja continua  representa la gr&aacute;fica de comportamiento del promedio entre todos los  clasificadores. Se puede notar que a partir de 600 t&eacute;rminos se alcanza el valor  m&aacute;ximo, el cual se mantiene relativamente estable en la regi&oacute;n delimitada, para  empeorar luego producto del efecto de los algoritmos KNN, LVQ3 y LVQ2.1. El  resto de los algoritmos logran un comportamiento con tendencia a mejorar o  mantenerse estables con el aumento del n&uacute;mero de t&eacute;rminos. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este trabajo se  evalu&oacute; la competitividad del algoritmo LVQ en las tres versiones que se  encuentran implementadas en la herramienta KEEL, fue utilizada la exactitud  predictiva como m&eacute;trica de evaluaci&oacute;n. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como tarea preliminar a este trabajo se logr&oacute; crear una colecci&oacute;n de 800  documentos textuales partiendo de noticias de medios de prensa en el idioma  ingl&eacute;s. Utilizando los pesos tf * idf del Modelo de Espacio  Vectorial de Salton (Salton et al. 1975).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se pudo acotar una  regi&oacute;n aceptable en cuanto al n&uacute;mero de t&eacute;rminos de la colecci&oacute;n de noticias  creada, puesto que se comprob&oacute; experimentalmente que los algoritmos SVM, NB,  C45 y LVQ1 de clasificaci&oacute;n funcionan bien a partir de solamente 400 t&eacute;rminos  de 21731 iniciales. Logr&aacute;ndose encontrar que alrededor de los 600 t&eacute;rminos se  encuentra un punto de muy buen desempe&ntilde;o para todos los algoritmos probados. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Por otro lado, aunque  se encontr&oacute; que los algoritmos LVQ2.1, LVQ3 y KNN funcionan bien en la regi&oacute;n  desde los 400 hasta los 900 t&eacute;rminos se pudo notar un deterioro gradual en el  desempe&ntilde;o de estos con el incremento de la cantidad de t&eacute;rminos por encima del  l&iacute;mite superior de la regi&oacute;n anteriormente delimitada.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como parte de este  trabajo se vislumbra que puede seguir profundiz&aacute;ndose en la evaluaci&oacute;n de las  distintas versiones del LVQ, en particular puede extenderse la implementaci&oacute;n  del KEEL para incorporar la versi&oacute;n OLVQ1 y as&iacute; poder evaluar su desempe&ntilde;o en  este contexto. Tomando como punto de partida la posibilidad que brinda OLVQ1 de  variar la tasa de aprendizaje durante el proceso de entrenamiento. Por otro lado,  puede comprobarse el desempe&ntilde;o del LVQ en colecciones de datos ruidosas o con  valores omitidos, las cuales est&aacute;n disponibles en la colecci&oacute;n que brinda la  herramienta KEEL.</font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">AHN,  K.K. &amp; NGUYEN, H.T.C., 2007. Intelligent switching control of a pneumatic muscle robot arm using  learning vector quantization neural network. <em>Mechatronics</em>, 17(4),  pp.255&ndash;262.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ALCAL&Aacute;-FDEZ, J. et al., 2008. KEEL&#8239;: a software tool to  assess evolutionary algorithms for data mining problems. <em>Soft Computing</em>,  13(3), pp.307&ndash;318.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ALCAL&Aacute;-FDEZ, J. et al., 2011. KEEL Data-Mining Software Tool:  Data Set Repository and Integration of Algorithms and Experimental Analysis Framework. <em>Journal of Multiple-Valued Logic and Soft Computing</em>, 17(2-3),  pp.255&ndash;287.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ANAGNOSTOPOULOS, C. et al., 2001. Training a learning vector  quantization network for biomedical classification. In <em>Proceedings of the  international joint conference on neural networks</em>. National Technical  University of Athens (NTUA), pp. 2506&ndash;2511.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BASHYAL, S. &amp; VENAYAGAMOORTHY, G.K., 2008. Recognition of  facial expressions using gabor wavelets and learning vector quantization. <em>Engineering  Applications of Artificial Intelligence</em>, 21(7), pp.1056&ndash;1064.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BASSIUNY, A., LI, X. &amp; Du, R., 2007. Fault diagnosis of stamping process based on empirical mode  decomposition and learning vector quantization. <em>Int J Mach Tools Manuf</em>,  47(15), pp.2298&ndash;2306.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BAYES, T., 1763. An Essay towards solving a Problem in the  Doctrine of Chances. <em>Philosophical Transactions of the Royal Society of  London</em>, 53, pp.370&ndash;418.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BEZDEK, J.C. &amp; Pal, N.R., 1995. Two soft relatives of  learning vector. <em>Neural Networks</em>, 8(5), pp.729&ndash;743.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BLUME, M. &amp; BALLARD, D.R., 2007. Image annotation based  on learning vector quantization and localized Haar wavelet transform features.  In S. K. Rogers, ed. <em>Society of photo-optical instrumentation engineers</em>.  pp. 181&ndash;190.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CHEN, C.Y., 2012. Accelerometer-based hand gesture  recognition using fuzzy learning vector quantization. <em>Adv Sci Lett</em>,  9(1), pp.38&ndash;44.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CORTES, C., VAPNIK, V. &amp; SAITTA, L., 1995. Support-Vector  Networks. <em>Machine Learning</em>, 20, pp.273&ndash;297.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">COVER, T.M., HART, P.E. &amp; STEVENS, K.N., 1967. Nearest  Neighbor. <em>IEEE Transactions on Information Theory</em>, IT-13(1), pp.21&ndash;27.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DIETERLE, F. et al., 2003. Urinary nucleosides as potential  tumor markers evaluated by learning vector quantization. <em>Artificial  Intelligence in Medicine</em>, 28(3), pp.265&ndash;280.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DOMINGOS, P. &amp; PAZZANI, M., 1997. On the Optimality of  the Simple Bayesian Classifier under Zero-One Loss. <em>Machine Learning</em>,  1997(29), pp.103&ndash;130.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DUTTA, S., CHATTERJEE, A. &amp; MUNSHI, S., 2001. Identification of ecg beats from cross-spectrum information  aided learning vector quantization. <em>Measurement</em>, 44(10), pp.2020&ndash;2027.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">FIX, E. &amp; HODGES, J.L., 1951. An Important Contribution  to Nonparametric Discriminant Analysis and Density Estimation. <em>International  Statistical Review</em>, 3(57), pp.233&ndash;238.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HALL, M. et al., 2009. The WEKA Data Mining Software: An Update. <em>SIGKDD Explorations</em>, 11(1), pp.10&ndash;18.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HAMMER, B. et al., 2011. Prototypebased classification of  dissimilarity data. <em>Lecture Notes in Computer Science</em>, 7014, pp.185&ndash;197.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HAMMER, B. &amp; VILLMANN, T., 2002. Generalized relevance  learning vector quantization. <em>Neural Networks</em>, 15(8-9), pp.1059&ndash;1068.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JOHN, G. &amp; LANGLEY, P., 1995. Estimating Continuous  Distributions in Bayesian Classifiers. In <em>In Proceedings of the Eleventh  Conference on Uncertainty in Artificial Intelligence</em>. Morgan Kaufmann, pp.  338&ndash;345.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KARAYIANNIS, N.B., 1997. A methodology for constructing fuzzy  algorithms for learning vector quantization. <em>IEEE Transactions on Neural  Networks</em>, 8(3), pp.505&ndash;518.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KARAYIANNIS, N.B., 1999. An axiomatic approach to soft  learning vector quantization and clustering. <em>IEEE Transactions on Neural  Networks</em>, 10(5), pp.1153&ndash;1165.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KARAYIANNIS, N.B. &amp; PAI, P.I., 1996. Fuzzy algorithms for  learning vector quantization. <em>IEEE Transactions on Neural Networks</em>,  7(5), pp.1196&ndash;1211.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KOHONEN, T., 1988. An introduction to neural computing. <em>Neural  networks&#8239;: the official journal of the International Neural Network Society</em>,  (1), pp.3&ndash;16.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KOHONEN, T., 2001. <em>Self-Organizing Maps</em> Third Exte.  Springer-Verlag, ed., Berlin, Heidelberg.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KOHONEN, T., 1990. The self organizing map. <em>Proceeding of  the IEEE</em>, 78(9), pp.1464&ndash;1480.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LIU, H. et al., 2002. Discretization: An Enabling Technique. <em>Data  Mining and Knowledge Discovery</em>, 6(4), pp.393&ndash;423.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MARON, M.E., 1961. Automatic Indexing&#8239;: An Experimental  Inquiry. <em>Journal of the ACM (JACM)</em>, 8:3(January), pp.404&ndash;417.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MCCLELLAND, J.L., RUMELHART, D.E. &amp; HINTON, G.E., 1987.  The Appeal of Parallel Distributed Processing. In D. E. RUMELHART, J. L. MCCLELLAND,  &amp; others, eds. <em>Parallel Distributed Processing: Volume 1: Foundations</em>.  Cambridge: MIT Press, pp. 3&ndash;44.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">NEURAL NETWORKS RESEARCH CENTRE, 2007. Bibliography on the  self-organizing map (som) and learning vector quantization (lvq). Available at:  http://liinwww.ira.uka.de/bibliography/Neural/SOM.LVQ.html.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">PAL, N.R., BEZDEK, J.C. &amp; TSAO, E.K., 1993. Generalized  clustering networks and kohonen&rsquo;s self-organizing scheme. <em>IEEE Transactions  on Neural Networks</em>, 4(4), pp.549&ndash;557.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">QIN, A.K. &amp; SUGANTHAN, P., 2004. A novel kernel  prototype-based learning algorithm. <em>Pattern Recognition</em>, 4, pp.621&ndash;624.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">QUINLAN, J.R., 1993. <em>C4.5: Programs for Machine Learning</em>,  San Francisco, CA, USA: Morgan Kaufmann Publishers Inc.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">QUINLAN, J.R., 1986. Induction of Decision Trees. <em>Machine  Learning</em>, 1, pp.81&ndash;106.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">RISSANEN, J., 1978. Modeling by shortest data description. <em>Automatica</em>,  14(5), pp.465&ndash;471.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SALTON, G., WONG, A. &amp; YANG, C.S., 1975. Vector Space  Model for Automatic Indexing. Information Retrieval and Language Processing. <em>Communications  of the ACM</em>, 18(11), pp.613&ndash;620.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SCHNEIDER, P., BIEHL, M. &amp; HAMMER, B., 2009. Distance  learning in discriminative vector quantization. <em>Neural Computation</em>,  21(10), pp.2942&ndash;2969.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">STANFILL, C. &amp; WALTZ, D., 1986. Instance-based Learning  Algorithms. <em>Communications of the ACM</em>, 12, pp.1213&ndash;1228.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WANG, J., NESKOVIC, P. &amp; COOPER, L.N., 2007. Improving  nearest neighbor rule with a simple adaptive distance measure. <em>Pattern  Recognition Letters</em>, 28, pp.207&ndash;213.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WILSON, D.R. &amp; Martinez, T.R., 2000. Reduction Tecniques  For Instance-Based Learning Algorithms. <em>Machine Learning</em>, 38:3,  pp.257&ndash;286.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WU, X. et al., 2007. Top 10 algorithms in data mining. <em>Knowledge  Information Systems</em>, (2008)(14), pp.1&ndash;37.</font></p>     <p name="_ENREF_1">&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 05/06/2016    <br> Aceptado: 28/08/2016</font></p>     ]]></body>
<body><![CDATA[ ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[AHN]]></surname>
<given-names><![CDATA[K.K]]></given-names>
</name>
<name>
<surname><![CDATA[NGUYEN]]></surname>
<given-names><![CDATA[H.T.C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Intelligent switching control of a pneumatic muscle robot arm using learning vector quantization neural network]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>17</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>255-262</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ALCALÁ-FDEZ]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[KEEL: a software tool to assess evolutionary algorithms for data mining problems.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>13</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>307-318</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ALCALÁ-FDEZ]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[KEEL Data-Mining Software Tool: Data Set Repository and Integration of Algorithms and Experimental Analysis Framework]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>17</volume>
<numero>2-3</numero>
<issue>2-3</issue>
<page-range>255-287</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ANAGNOSTOPOULOS]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[Training a learning vector quantization network for biomedical classification.]]></source>
<year>2001</year>
<page-range>. 2506-2511</page-range><publisher-name><![CDATA[National Technical University of Athens (NTUA]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BASHYAL]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[VENAYAGAMOORTHY]]></surname>
<given-names><![CDATA[G.K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Recognition of facial expressions using gabor wavelets and learning vector quantization]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>21</volume>
<numero>7</numero>
<issue>7</issue>
<page-range>1056-1064</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BASSIUNY]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[LI]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Du]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fault diagnosis of stamping process based on empirical mode decomposition and learning vector quantization]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>47</volume>
<numero>15</numero>
<issue>15</issue>
<page-range>2298-2306</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BAYES]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[An Essay towards solving a Problem in the Doctrine of Chances]]></source>
<year>1763</year>
<volume>53</volume>
<page-range>370-418</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BEZDEK]]></surname>
<given-names><![CDATA[J.C]]></given-names>
</name>
<name>
<surname><![CDATA[Pal]]></surname>
<given-names><![CDATA[N.R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Two soft relatives of learning vector]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>8</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>.729-743</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BLUME]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[BALLARD]]></surname>
<given-names><![CDATA[D.R]]></given-names>
</name>
</person-group>
<source><![CDATA[Image annotation based on learning vector quantization and localized Haar wavelet transform features]]></source>
<year>2007</year>
<page-range>181-190</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHEN]]></surname>
<given-names><![CDATA[C.Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Accelerometer-based hand gesture recognition using fuzzy learning vector quantization.]]></source>
<year>2012</year>
<volume>9</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>.38-44</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CORTES]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[VAPNIK]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[SAITTA]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[Support-Vector Networks]]></source>
<year>1995</year>
<volume>20</volume>
<page-range>273-297</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[COVER]]></surname>
<given-names><![CDATA[T.M]]></given-names>
</name>
<name>
<surname><![CDATA[HART]]></surname>
<given-names><![CDATA[P.E]]></given-names>
</name>
<name>
<surname><![CDATA[STEVENS]]></surname>
<given-names><![CDATA[K.N]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Nearest Neighbor]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>13</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>21-27</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DIETERLE]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Urinary nucleosides as potential tumor markers evaluated by learning vector quantization]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>28</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>265-280</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DOMINGOS]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[PAZZANI]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the Optimality of the Simple Bayesian Classifier under Zero-One Loss]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>199</volume>
<numero>29</numero>
<issue>29</issue>
<page-range>103-130</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DUTTA]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[CHATTERJEE]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[MUNSHI]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Identification of ecg beats from cross-spectrum information aided learning vector quantization]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>44</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>2020-2027</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FIX]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[HODGES]]></surname>
<given-names><![CDATA[J.L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Important Contribution to Nonparametric Discriminant Analysis and Density Estimation]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>3</volume>
<numero>57</numero>
<issue>57</issue>
<page-range>233-238</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HALL]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The WEKA Data Mining Software: An Update]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>11</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>10-18</page-range></nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HAMMER]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<source><![CDATA[Prototypebased classification of dissimilarity data]]></source>
<year>2011</year>
<volume>7014</volume>
<page-range>185-197</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HAMMER]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[VILLMANN]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Generalized relevance learning vector quantization]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>15</volume>
<numero>8-9</numero>
<issue>8-9</issue>
<page-range>1059-1068</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[JOHN]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[LANGLEY]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Estimating Continuous Distributions in Bayesian Classifiers]]></source>
<year>1995</year>
<page-range>338-345</page-range><publisher-name><![CDATA[Morgan Kaufmann]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KARAYIANNIS]]></surname>
<given-names><![CDATA[N.B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A methodology for constructing fuzzy algorithms for learning vector quantization.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>8</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>505-518</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KARAYIANNIS]]></surname>
<given-names><![CDATA[N.B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An axiomatic approach to soft learning vector quantization and clustering.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>10</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>1153-1165</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KARAYIANNIS]]></surname>
<given-names><![CDATA[N.B]]></given-names>
</name>
<name>
<surname><![CDATA[PAI]]></surname>
<given-names><![CDATA[P.I]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fuzzy algorithms for learning vector quantization]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>7</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>1196-1211</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KOHONEN]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[An introduction to neural computing. Neural networks: the official journal of the International Neural Network Society]]></source>
<year>1988</year>
<volume>1</volume>
<page-range>.3-16</page-range></nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KOHONEN]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Self-Organizing Maps Third Exte]]></source>
<year>2001</year>
<publisher-loc><![CDATA[^eBerlin Berlin]]></publisher-loc>
<publisher-name><![CDATA[Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KOHONEN]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The self organizing map]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>78</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>1464-1480</page-range></nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LIU]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Discretization: An Enabling Technique]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>6</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>393-423</page-range></nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MARON]]></surname>
<given-names><![CDATA[M.E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Automatic Indexing: An Experimental Inquiry]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>8</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>404-417</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MCCLELLAND]]></surname>
<given-names><![CDATA[J.L]]></given-names>
</name>
<name>
<surname><![CDATA[RUMELHART]]></surname>
<given-names><![CDATA[D.E]]></given-names>
</name>
<name>
<surname><![CDATA[HINTON]]></surname>
<given-names><![CDATA[G.E]]></given-names>
</name>
</person-group>
<source><![CDATA[The Appeal of Parallel Distributed Processing]]></source>
<year>1987</year>
<volume>Volume 1</volume>
<page-range>3-44</page-range><publisher-name><![CDATA[Cambridge: MIT Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[NEURAL NETWORKS RESEARCH CENTRE]]></surname>
</name>
</person-group>
<source><![CDATA[Bibliography on the self-organizing map (som) and learning vector quantization]]></source>
<year>2007</year>
</nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[PAL]]></surname>
<given-names><![CDATA[N.R]]></given-names>
</name>
<name>
<surname><![CDATA[BEZDEK]]></surname>
<given-names><![CDATA[J.C]]></given-names>
</name>
<name>
<surname><![CDATA[TSAO]]></surname>
<given-names><![CDATA[E.K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Generalized clustering networks and kohonen&#8217;s self-organizing scheme]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>4</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>549-557</page-range></nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[QIN]]></surname>
<given-names><![CDATA[A.K]]></given-names>
</name>
<name>
<surname><![CDATA[SUGANTHAN]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[A novel kernel prototype-based learning algorithm]]></source>
<year>2004</year>
<volume>4</volume>
<page-range>621-624</page-range></nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[QUINLAN]]></surname>
<given-names><![CDATA[J.R]]></given-names>
</name>
</person-group>
<source><![CDATA[: Programs for Machine Learning]]></source>
<year>1993</year>
<publisher-loc><![CDATA[San Francisco^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Morgan Kaufmann Publishers Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[QUINLAN]]></surname>
<given-names><![CDATA[J.R]]></given-names>
</name>
</person-group>
<source><![CDATA[Induction of Decision Trees]]></source>
<year>1986</year>
<volume>1</volume>
<page-range>81-106</page-range></nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RISSANEN]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Modeling by shortest data description]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>14</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>465-471</page-range></nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SALTON]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[WONG]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[C.S]]></surname>
<given-names><![CDATA[YANG]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Vector Space Model for Automatic Indexing]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>18</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>613-620</page-range></nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SCHNEIDER]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[BIEHL]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[HAMMER]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Distance learning in discriminative vector quantization.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>21</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>2942-2969</page-range></nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[STANFILL]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[WALTZ]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Instance-based Learning Algorithms]]></source>
<year>1986</year>
<volume>12</volume>
<page-range>1213-1228</page-range></nlm-citation>
</ref>
<ref id="B39">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WANG]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[NESKOVIC]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[COOPER]]></surname>
<given-names><![CDATA[L.N]]></given-names>
</name>
</person-group>
<source><![CDATA[Improving nearest neighbor rule with a simple adaptive distance measure]]></source>
<year>2007</year>
<volume>28</volume>
<page-range>pp.207-213</page-range><publisher-name><![CDATA[Pattern Recognition Letters]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B40">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WILSON]]></surname>
<given-names><![CDATA[D.R]]></given-names>
</name>
<name>
<surname><![CDATA[Martinez]]></surname>
<given-names><![CDATA[T.R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reduction Tecniques For Instance-Based Learning Algorithms]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>38</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>257-286</page-range></nlm-citation>
</ref>
<ref id="B41">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WU]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
</person-group>
<source><![CDATA[Top 10 algorithms in data mining]]></source>
<year>2007</year>
<volume>14</volume>
<page-range>pp.1-37</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
