<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000300013</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Taxobanger v.1.0: Aplicación informática en R para el análisis taxonómico en bancos de germoplasma vegetal]]></article-title>
<article-title xml:lang="en"><![CDATA[Taxobanger v.1.0: Computer application in R for the taxonomic analysis in plant germplasm banks]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Molina Concepción]]></surname>
<given-names><![CDATA[Osmany]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Milián Jiménez]]></surname>
<given-names><![CDATA[Marilys]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Pons Pérez]]></surname>
<given-names><![CDATA[Carmen C]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[González Díaz]]></surname>
<given-names><![CDATA[Lianet]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Grau Abalo]]></surname>
<given-names><![CDATA[Ricardo]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Instituto de Investigaciones de Viandas Tropicales (INIVIT)  ]]></institution>
<addr-line><![CDATA[ Villa Clara]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Central Marta Abreu de Las Villas  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>3</numero>
<fpage>159</fpage>
<lpage>173</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000300013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000300013&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000300013&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN Los recursos fitogenéticos se han convertido en una prioridad científica, lo cual hace importante el análisis de esta diversidad mediante métodos cuantitativos que ayuden a agrupar poblaciones de un mismo género o especie. Con el objetivo de desarrollar una aplicación informática para el análisis taxonómico en las colecciones de germoplasma que se conservan en el Instituto de Investigaciones de Viandas Tropicales, se utilizó el lenguaje y entorno de programación para análisis estadístico y gráfico R. Se logró la aglutinación en un solo programa de funciones que permiten la obtención y manipulación de datos, la definición del nivel de medición de las variables y la ejecución de cuatro estrategias de clasificación que definen diferentes estructuras de datos a partir de la combinación de técnicas estadísticas que determinan aquellos conglomerados que se ajustan mejor a las características de las colecciones del germoplasma. Además, esta aplicación permite a los curadores de bancos de germoplasma contar con una herramienta informática que ayuda a la clasificación de la variabilidad conservada a partir de los rasgos que le caracterizan, sin necesidad de poseer amplios conocimientos en las técnicas estadísticas y computacionales. Esto es altamente cualificado debido a que ahorra tiempo en el procesamiento estadístico y brinda mayor visión y fiabilidad en los resultados obtenidos. El trabajo desarrollado favorece el manejo de la biodiversidad conservada en los bancos de germoplasma y amplía su utilización en el mejoramiento genético de las especies vegetales, pues permite un mejor uso de la información y una manipulación eficiente del material genético que se posee.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT Plant genetic resources have become a scientific priority, which makes it so important to analyze this diversity through quantitative methods that help to group populations of the same genus or species. The language and programming environment for statistical analysis and graph known as R, was used in order to develop an application software for the taxonomic analysis of the germplasm collections preserved in the Institute of Research of Tropical Root and Tuber Crops. Agglutination was achieved in a single program of functions that allows the collection and manipulation of data, the definition of the level of measurement of variables and the execution of four strategies for classification. These strategies define different data structures from the combination of statistical techniques that determine those conglomerates that better match the characteristics of germplasm collections. In addition, this application software allows the curators of germplasm banks to have a computer tool that helps in the classification of preserved variability according to its characters, no need to have an extensive knowledge in the statistics and computational techniques. This is highly qualified, because it saves time in statistical processing and provides broader vision and reliability in the obtained results. The present research favors the management of the biodiversity preserved in germplasm banks and extends its use in the genetic improvement of plant species, since it allows a better use of the information and an efficient handling of the genetic material.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[clasificación]]></kwd>
<kwd lng="es"><![CDATA[software libre]]></kwd>
<kwd lng="es"><![CDATA[programación en lenguaje R]]></kwd>
<kwd lng="es"><![CDATA[recursos fitogenéticos]]></kwd>
<kwd lng="en"><![CDATA[Classification]]></kwd>
<kwd lng="en"><![CDATA[free software]]></kwd>
<kwd lng="en"><![CDATA[R programming language]]></kwd>
<kwd lng="en"><![CDATA[genetic resources]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Taxobanger v.1.0: Aplicaci&oacute;n inform&aacute;tica en R para el  an&aacute;lisis taxon&oacute;mico en bancos de germoplasma vegetal</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><em><font face="Verdana, Arial, Helvetica, sans-serif">Taxobanger v.1.0: Computer  application in R for the taxonomic analysis in plant germplasm banks</font></em></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Osmany Molina Concepci&oacute;n<strong><sup>1*</sup></strong>, Marilys Mili&aacute;n Jim&eacute;nez<strong><sup>1</sup></strong>, Carmen C. Pons P&eacute;rez</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>1</sup></strong></font></font><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">, Lianet Gonz&aacute;lez D&iacute;az</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>1</sup></strong></font></font><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">, Ricardo Grau Abalo</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup></strong></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Instituto de Investigaciones de Viandas Tropicales (INIVIT), Cuba.  INIVIT, Apartado 6, Santo Domingo, CP: 53 000, Villa Clara, Cuba      <br>     <sup>2</sup>Universidad Central &ldquo;Marta Abreu&rdquo; de Las Villas  (UCLV), Cuba    ]]></body>
<body><![CDATA[<br> </font></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:taxonumeric@inivit.cu">taxonumeric@inivit.cu</a></font>      <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  recursos fitogen&eacute;ticos se han convertido en una prioridad cient&iacute;fica, lo cual  hace importante el an&aacute;lisis de esta diversidad mediante m&eacute;todos cuantitativos  que ayuden a agrupar poblaciones de un mismo g&eacute;nero o especie. Con el objetivo  de desarrollar una aplicaci&oacute;n inform&aacute;tica para el an&aacute;lisis taxon&oacute;mico en las  colecciones de germoplasma que se conservan en el Instituto de Investigaciones  de Viandas Tropicales, se utiliz&oacute; el lenguaje y entorno de programaci&oacute;n para an&aacute;lisis  estad&iacute;stico y gr&aacute;fico <em>R.</em> Se logr&oacute; la aglutinaci&oacute;n en un solo programa de funciones que  permiten la obtenci&oacute;n y manipulaci&oacute;n de datos, la definici&oacute;n del nivel de  medici&oacute;n de las variables y la ejecuci&oacute;n de cuatro estrategias de clasificaci&oacute;n  que definen diferentes estructuras de datos a partir de la combinaci&oacute;n de  t&eacute;cnicas estad&iacute;sticas que determinan aquellos conglomerados que se ajustan  mejor a las caracter&iacute;sticas de las colecciones del germoplasma. Adem&aacute;s, esta  aplicaci&oacute;n permite a los curadores de bancos de germoplasma contar con una  herramienta inform&aacute;tica que ayuda a la clasificaci&oacute;n de la variabilidad  conservada a partir de los rasgos que le caracterizan, sin necesidad de poseer  amplios conocimientos en las t&eacute;cnicas estad&iacute;sticas y computacionales. Esto es  altamente cualificado debido a que ahorra tiempo en el procesamiento  estad&iacute;stico y brinda mayor visi&oacute;n y fiabilidad en los resultados  obtenidos.&nbsp; El trabajo desarrollado  favorece el manejo de la biodiversidad conservada en los bancos de germoplasma  y ampl&iacute;a su utilizaci&oacute;n en el mejoramiento gen&eacute;tico de las especies vegetales,  pues permite un mejor uso de la informaci&oacute;n y una manipulaci&oacute;n eficiente del  material gen&eacute;tico que se posee.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">clasificaci&oacute;n, software libre,  programaci&oacute;n en lenguaje R, recursos fitogen&eacute;ticos</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Plant genetic resources have  become a scientific priority, which makes it so important to analyze this  diversity through quantitative methods that help to group populations of the  same genus or species. The language and programming environment for statistical  analysis and graph known as R, was used in order to develop an application  software for the taxonomic analysis of the germplasm collections preserved in  the Institute of Research of Tropical Root and Tuber Crops. Agglutination was  achieved in a single program of functions that allows the collection and  manipulation of data, the definition of the level of measurement of variables  and the execution of four strategies for classification. These strategies  define different data structures from the combination of statistical techniques  that determine those conglomerates that better match the characteristics of  germplasm collections.&nbsp; In addition, this  application software allows the curators of germplasm banks to have a computer  tool that helps in the classification of preserved variability according to its  characters, no need to have an extensive knowledge in the statistics and  computational techniques. This is highly qualified, because it saves time in  statistical processing and provides broader vision and reliability in the  obtained results. The present research favors the management of the  biodiversity preserved in germplasm banks and extends its use in the genetic  improvement of plant species, since it allows a better use of the information  and an efficient handling of the genetic material.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>Classification,  free software, R programming language, genetic resources</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Aunque la  interacci&oacute;n de la estad&iacute;stica matem&aacute;tica y la biolog&iacute;a no es algo nuevo, el  extraordinario desarrollo de la inform&aacute;tica en los &uacute;ltimos tiempos ha  contribuido a popularizar el empleo de novedosos y m&aacute;s complejos m&eacute;todos de  an&aacute;lisis e interpretaci&oacute;n. Un ejemplo de lo anterior lo constituye la taxonom&iacute;a  num&eacute;rica a partir del an&aacute;lisis multivariado que se le realiza a los elementos morfoagron&oacute;micos,  insoenzim&aacute;ticos y moleculares de las colecciones de germoplasma. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los an&aacute;lisis estad&iacute;sticos ponen a  disposici&oacute;n un conjunto de herramientas muy amplio, muchas de las cuales han  sido desarrolladas desde hace alg&uacute;n tiempo, pero que han experimentado en los  &uacute;ltimos a&ntilde;os una importante revoluci&oacute;n con el planteamiento de nuevos m&eacute;todos,  sobre todo motivados por la utilizaci&oacute;n de programas computacionales como  herramientas de c&aacute;lculo. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La necesidad de comprender las  relaciones entre muchas variables hace de&nbsp;  los m&eacute;todos multivariados una t&eacute;cnica inherentemente compleja (Bramardi, 2002), adem&aacute;s se necesita mayor cantidad  de c&aacute;lculos matem&aacute;ticos para aplicarlos que para hacer inferencias en un  conjunto univariado de datos, por tanto, es obvio que para ejecutar estos tipos  de t&eacute;cnicas se hace imprescindible el uso de un <em>software</em> que, no solo efect&uacute;e los algoritmos de c&aacute;lculo, sino que  gu&iacute;e al usuario que no es experto en estad&iacute;stica en esta complicada tarea y le  ayude a interpretar los resultados.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En t&eacute;rminos generales, el an&aacute;lisis multivariado  se refiere a todos aquellos m&eacute;todos estad&iacute;sticos que analizan simult&aacute;neamente  medidas m&uacute;ltiples (m&aacute;s de dos variables) de cada individuo (Hair et al., 1992). En la actualidad, los bancos de  germoplasma de Cuba y de otros pa&iacute;ses poseen su documentaci&oacute;n, donde se recogen  datos morfoagron&oacute;micos y caracter&iacute;sticas detectables visualmente que s&oacute;lo se  expresan como reacci&oacute;n a est&iacute;mulos del medio ambiente, denominadas de  evaluaci&oacute;n; pero la mayor&iacute;a de sus curadores no tienen los conocimientos  estad&iacute;sticos ni las herramientas inform&aacute;ticas necesarias para llevar a cabo una  taxonom&iacute;a num&eacute;rica espec&iacute;fica para estos casos, haciendo un mejor uso de la  informaci&oacute;n extra&iacute;da y una manipulaci&oacute;n eficiente del material gen&eacute;tico que poseen  (Franco y Hidalgo, 2003).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los datos se pueden analizar mediante  el empleo de m&eacute;todos simples o complejos, que van desde el uso de gr&aacute;ficos y  estad&iacute;sticos de tendencia central y dispersi&oacute;n hasta los multivariados. El  an&aacute;lisis tiene el prop&oacute;sito de reducir el volumen de informaci&oacute;n en trabajos de  esta naturaleza y llegar a conclusiones acerca de la variabilidad y la utilidad  del germoplasma, por tanto, los datos deben representar fielmente las  caracter&iacute;sticas de las accesiones.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Existen actualmente gran variedad de  programas computacionales relacionados con el almacenamiento de datos de bancos  de germoplasma, as&iacute; como programas estad&iacute;sticos propietarios utilizados  frecuentemente en el an&aacute;lisis y obtenci&oacute;n de resultados, pero el empleo  eficiente de estos &uacute;ltimos requiere de la integraci&oacute;n a un alto nivel de  conocimientos estad&iacute;sticos e inform&aacute;ticos para manipular correctamente sus  potencialidades e interpretar adecuadamente los resultados obtenidos por parte  de los curadores y especialistas en mejoramiento gen&eacute;tico.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Es innegable que el an&aacute;lisis  estad&iacute;stico con aplicaciones inform&aacute;ticas presenta ventajas para el  usuario:&nbsp; se disponen los datos en una  estructura tabular o&nbsp; en una matriz de  datos, se permiten varias v&iacute;as r&aacute;pidas y muy seguras para detectar errores,&nbsp; se logra simplicidad de ejecuci&oacute;n y precisi&oacute;n  de los c&aacute;lculos obtenidos, se hace viable la manipulaci&oacute;n de voluminosas bases  de datos, as&iacute; como una r&aacute;pida reproducibilidad de los an&aacute;lisis estad&iacute;sticos, se  proporciona amplia facilidad y flexibilidad en el manejo de los gr&aacute;ficos.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En los &uacute;ltimos a&ntilde;os, ha surgido con  fuerza como alternativa de <em>software</em> libre en muy distintos ambientes docentes y de investigaci&oacute;n, un lenguaje de  programaci&oacute;n especialmente indicado para el an&aacute;lisis estad&iacute;stico, denominado R (Ihaka y Gentleman, 1996).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El R (R Development Core Team, 2017b) es un lenguaje de programaci&oacute;n  principalmente orientado al an&aacute;lisis estad&iacute;stico y visualizaci&oacute;n de informaci&oacute;n  cuantitativa y cualitativa. Fue oficialmente presentado en 1997 y es un <em>software</em> libre que se rige por la  licencia general p&uacute;blica (&ldquo;<em>General Public  License</em>&rdquo; o GPL) de la fundaci&oacute;n de <em>software</em> libre (<em>&ldquo;Free Software Foundation</em>&rdquo; o  GNU). Una de sus grandes fortalezas es que puede ser ampliado mediante paquetes  que extienden sus funcionalidades. Actualmente hay m&aacute;s de 10683 paquetes  publicados con licencias libres y disponibles en un repositorio general (R Development Core Team, 2017a). A diferencia de la mayor&iacute;a de los  programas que tienen interfaces tipo ventana, R es manejado a trav&eacute;s de una  consola en la que se introduce comandos propios de su lenguaje para acceder a  todos los procedimientos, sin embargo, es posible dise&ntilde;ar interfaces gr&aacute;ficas  para facilitar la interacci&oacute;n con los usuarios no familiarizados con su consola  (Salas, 2008).     <br>   R permite la interconexi&oacute;n con otros <em>softwares</em> de c&oacute;digo abierto como el <em>Java</em> y el <em>Weka</em>, <em>(Waikato Environment  for Knowledge Analysis)</em> lo que aumenta sus potencialidades de una manera  impresionante.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El objetivo de este trabajo fue crear una interfaz en  lenguaje Rque facilite realizar la  taxonom&iacute;a num&eacute;rica en bancos de germoplasma con vista a ayudar a los curadores  en la interpretaci&oacute;n y extracci&oacute;n de informaci&oacute;n &uacute;til a partir de los datos  disponibles. Se logr&oacute; la aglutinaci&oacute;n en un solo programa de funciones que  permiten la obtenci&oacute;n y manipulaci&oacute;n de datos, la definici&oacute;n del nivel de  medici&oacute;n de las variables y la ejecuci&oacute;n de cuatro estrategias de clasificaci&oacute;n  que definen diferentes estructuras de datos a partir de la combinaci&oacute;n de  t&eacute;cnicas estad&iacute;sticas que determinan aquellos conglomerados que se ajustan  mejor a las caracter&iacute;sticas de las colecciones del germoplasma<em>.</em></font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El trabajo se desarroll&oacute; por el grupo  de Bioinform&aacute;tica del Instituto de Investigaciones de Viandas Tropicales  (INIVIT), partiendo de un dise&ntilde;o logrado sobre el an&aacute;lisis de los  requerimientos, que son el conjunto de t&eacute;cnicas y procedimientos utilizados  para conocer los elementos necesarios a definir y especificar su funci&oacute;n, vincular  la interfaz con otros elementos del sistema y establecer los enlaces de dise&ntilde;o  que debe cumplir el programa.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los requerimientos fueron expuestos  por investigadores que manejan los bancos de germoplasma y que tienen previa  experiencia en el desarrollo de los an&aacute;lisis multivariados aplicados a la  taxonom&iacute;a num&eacute;rica mediante otros programas estad&iacute;sticos. A partir de esto  fueron seleccionados los siguientes an&aacute;lisis que incluyen m&eacute;todos de  ordenamiento y clasificaci&oacute;n de: conglomerados, discriminantes, componentes  principales y correspondencia m&uacute;ltiple. Y como eje fundamental de la aplicaci&oacute;n  cuatro variantes combinatorias de datos, que permite mezclar datos cualitativos  y cuantitativos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El dise&ntilde;o de la aplicaci&oacute;n fue  logrado sobre el an&aacute;lisis de los requerimientos, que son el conjunto de  t&eacute;cnicas y procedimientos utilizados para conocer los elementos necesarios a  definir y especificar su funci&oacute;n, vincular la interfaz con otros elementos del  sistema y establecer los enlaces de dise&ntilde;o que debe cumplir el programa.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El procesamiento incluye un sistema  de asistencia al usuario final que le sugiere los pasos a seguir en el an&aacute;lisis  de sus datos y ayuda a interpretar los resultados, proporcion&aacute;ndole opiniones  sobre la forma m&aacute;s correcta de proceder, mediante el c&aacute;lculo de &iacute;ndices y la  visualizaci&oacute;n a trav&eacute;s de tablas y gr&aacute;ficos de los resultados. Para lograr este  sistema se confront&oacute; con criterios dados por los especialistas de los bancos de  germoplasma y se aprovecharon los conocimientos de expertos en estad&iacute;stica.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La programaci&oacute;n de los algoritmos se  ejecut&oacute; en el lenguaje R, utilizando sus amplias potencialidades al tener  disponible en su sitio en Internet una gran cantidad de paquetes con una vasta  variedad de funciones que se pueden utilizar en la programaci&oacute;n. Entre estos  paquetes est&aacute; el tcltk2 (Grosjean, 2012) que incluye m&uacute;ltiples elementos  utilizados en la confecci&oacute;n de la interfaz de usuario, entre ellos: ventanas,  men&uacute;s, barras de desplazamiento, botones, botones radiales, cuadros de texto,  etiquetas de texto, cuadros de selecci&oacute;n, cajas de listas, conjuntos, entre  otros. Adem&aacute;s fueron incluidas funciones pertenecientes a otros paquetes tales  como: XLConnect (Studer, 2017), RODBC (Ripley y Lapsley, 2017), FactoMineR (Sebastian, 2008),  GPArotation (Bernaards y Jennrich, 2005), cluster (Maechler et al., 2017), clusterSim (Walesiak y Dudek, 2017),<em> clue</em> (Hornik, 2017) y los paquetes <em>stats</em> que forma parte de la librer&iacute;a b&aacute;sica de R que se instala por  defecto. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la ejecuci&oacute;n de la interfaz debe  instalarse primeramente la consola de R y a partir de ella, tecleando una  instrucci&oacute;n (<em>source (&ldquo;start.r</em>&rdquo;)), se  llama al fichero principal que contiene la ventana de entrada; pero tambi&eacute;n se  puede conformar el fichero de configuraci&oacute;n del R, que est&aacute; dentro de la  carpeta donde este <em>software</em> se  instala (Rprofile.site), para que autom&aacute;ticamente se haga la ejecuci&oacute;n. Se  requiere de una plataforma Windows&Ograve; 9x o superior y capacidad en disco  duro de 750 Mb como m&iacute;nimo.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como  resultado se obtuvo una interfaz con un dise&ntilde;o atractivo, amistoso y de f&aacute;cil  manipulaci&oacute;n, de forma tal que realmente constituye una herramienta eficaz en  manos de los usuarios potenciales y les ayuda en la conservaci&oacute;n del  germoplasma y en el uso m&aacute;s eficiente de los recursos fitogen&eacute;ticos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La interfaz est&aacute; compuesta por  una ventana principal con una barra de men&uacute;s en la parte superior y al usuario  cargar los datos. La primera opci&oacute;n de la barra de men&uacute;s &ldquo;Fichero&rdquo; permite  abrir el fichero de datos en formatos: <em>Excel</em> (.xls o .xlsx), <em>SPSS</em> (.sav) y fichero  de <em>texto</em> (.csv o txt), adem&aacute;s tiene  una opci&oacute;n <em>Editar Datos</em> una vez  cargados en memoria (<a href="#f01">Figura 1</a>). </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0113317.jpg" alt="f01" width="487" height="414"><a name="f01"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A trav&eacute;s de  la segunda opci&oacute;n de la barra de men&uacute;s &ldquo;Variables&rdquo; se establecen los niveles de  medici&oacute;n de las variables que pueden ser: dicot&oacute;micas, nominales, ordinales y  continuas (<a href="#f02">Figura 2</a>).</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0213317.jpg" alt="f02" width="455" height="471"><a name="f02"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Mediante la  opci&oacute;n &ldquo;Analizar&rdquo; de la barra de men&uacute;s se accede a los an&aacute;lisis multivariados.  En la ejecuci&oacute;n de los m&eacute;todos se muestran los resultados en forma de tablas o  gr&aacute;ficos, junto a sugerencias o interpretaciones ofrecidas, con vista a ayudar  al curador a comprender las salidas obtenidas. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Estos  m&eacute;todos se encuentran catalogados en dos tipos: de <em>Reducci&oacute;n de datos</em> y <em>Clasificar</em>.  Dentro de los m&eacute;todos de reducci&oacute;n de datos se encuentran: <em>An&aacute;lisis de Correspondencias M&uacute;ltiple</em> y <em>An&aacute;lisis de Componentes Principales.</em></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>An&aacute;lisis de Correspondencias M&uacute;ltiple</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para este  an&aacute;lisis se pueden seleccionar variables discretas (ordinales y nominales).  Inicialmente se calculan los autovalores, la varianza y la varianza acumulada  para poder definir el n&uacute;mero de componentes, luego se muestran los resultados  en tablas acompa&ntilde;ados de gr&aacute;ficos que ayudan al usuario al razonamiento  estad&iacute;stico y permiten observar la correspondencia entre las variables (Figura  3).</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0313317.jpg" alt="f03" width="449" height="453"><a name="f03"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">An&aacute;lisis de Componentes Principales </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para este  an&aacute;lisis se pueden seleccionar solo variables continuas, primeramente, se  calcula la matriz de correlaciones con el prop&oacute;sito de analizar si las  variables est&aacute;n correlacionadas y por tanto es factible llevar a cabo el  an&aacute;lisis. Luego se selecciona el n&uacute;mero de factores &oacute;ptimos, a trav&eacute;s de  m&eacute;todos anal&iacute;ticos y visuales (<a href="#f04">Figura 4</a>). Por &uacute;ltimo, se ofrecen las  puntuaciones factoriales para cada individuo junto a varios gr&aacute;ficos que  permiten analizar el comportamiento tanto de las variables como de los  individuos en las nuevas dimensiones.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Dentro de los m&eacute;todos de  clasificaci&oacute;n est&aacute;n programados: <em>An&aacute;lisis  de Conglomerados</em> y <em>Conglomerados  Mixto</em>. </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0413317.jpg" alt="f04" width="434" height="471"><a name="f04"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">An&aacute;lisis de conglomerados para variables  continuas</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para este an&aacute;lisis se pueden  seleccionar variables continuas, dentro de las que se pueden incluir las  contribuciones obtenidas para los individuos en las nuevas dimensiones a trav&eacute;s  de uno de los m&eacute;todos anteriores de reducci&oacute;n de datos. En primer lugar, se  lleva a cabo una conglomeraci&oacute;n jer&aacute;rquica y para esto, primeramente, se  normalizan las variables, posteriormente se selecciona la medida de distancia  mediante uno de los m&eacute;todos contemplados y se comparan los resultados en  dependencia del coeficiente de correlaci&oacute;n cofen&eacute;tico obtenido para identificar  cual es m&aacute;s id&oacute;nea en el conjunto de datos que se procesa. En el pr&oacute;ximo paso  se establece mediante un proceso iterativo el m&eacute;todo de conglomeraci&oacute;n m&aacute;s adecuado  <a href="#f05">(Figura 5)</a> y el n&uacute;mero de conglomerados &oacute;ptimo, calculando &iacute;ndices y analizando  las salidas a trav&eacute;s de gr&aacute;ficos. Por &uacute;ltimo, se efect&uacute;a una conglomeraci&oacute;n  particional con el n&uacute;mero de conglomerados anteriormente establecido y se  obtiene el conglomerado a que pertenece cada individuo. </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0513317.jpg" alt="f05" width="468" height="447"><a name="f05"></a></p>     ]]></body>
<body><![CDATA[<p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Conglomerados para variables mixtas</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La meta  principal de esta aplicaci&oacute;n es la concepci&oacute;n de cuatro variantes combinatorias  de datos, que permite mezclar datos cualitativos y cuantitativos <a href="/img/revistas/rcci/v11n3/f0613317.jpg" target="_blank">(Figura 6)</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con las bases  de datos de prueba de las colecciones de malanga (<em>Xanthosoma</em> spp.), &ntilde;ame (<em>Dioscorea</em> spp.) y pl&aacute;tanos (<em>Musa </em>spp.)  que se conservan del Instituto de Investigaciones de Viandas Tropicales  (INIVIT), se llevaron a cabo cuatro variantes combinatorias de datos para  probar la eficacia de &eacute;stos con la estructura de an&aacute;lisis propuesta a partir de  un conjunto de t&eacute;cnicas estad&iacute;sticas para determinar los conglomerados que se  ajustan mejor a las caracter&iacute;sticas del germoplasma en estudio. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la primera  variante se realiz&oacute; un estudio de la m&eacute;trica de (Gower, 1971) para variables mixtas donde se  integran las variables cualitativas (nominales y ordinales) y las  cuantitativas, la misma est&aacute; implementada en la funci&oacute;n <em>gowdis</em>()<em>,</em> descrita en el  paquete <em>FD </em>(Lalibert&eacute; y Legendre, 2010;  Lalibert&eacute; et al., 2015)<em>.</em> En la segunda se integraron las variables  cualitativas a las cuantitativas codificadas (seg&uacute;n Sistema de Descriptores M&iacute;nimos) tratadas como ordinales. En  esta variante, las caracter&iacute;sticas cuantitativas son llevadas a rangos  establecidos para estas colecciones, est&aacute; transformaci&oacute;n reduce el impacto de  los <em>ouliers</em> (valores fuera de rango)  en los datos (Milligan y  Cooper, 1988). A la matriz de datos resultantes se  le aplic&oacute; la m&eacute;trica de Gower.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la variante 3 se integraron las  variables cualitativas transformadas a trav&eacute;s del an&aacute;lisis de correspondencia  m&uacute;ltiple (Tenenhaus y Young, 1985) con la funci&oacute;n <em>MCA</em>() descrita en el paquete <em>FactoMineR</em>,  tomando las dimensiones que acumularon una varianza superior a uno con las  cuantitativas normalizadas para lo cual se us&oacute; la funci&oacute;n <em>data.Normalization</em>()&nbsp; del  paquete <em>clusterSim</em> con transformaci&oacute;n  por puntuaciones Z (<em>z-score</em>).  Posteriormente se unieron ambos resultados en una sola matriz de datos  continuos. En la cuarta variante a las variables cualitativas se le realiz&oacute; un  procedimiento similar al empleado en la variante tres, y con las variables  cuantitativas despu&eacute;s de estandarizada con la funci&oacute;n <em>data.Normalization</em>() del paquete <em>clusterSim</em> se realiz&oacute; un An&aacute;lisis de Componentes Principales  mediante la funci&oacute;n <em>precomp</em>()del paquete <em>stats</em>, se tomaron las mayores contribuciones a los ejes factoriales  de las accesiones. Con la uni&oacute;n de ambos resultados se conform&oacute; una matriz de  datos continuos. Como medida para evaluar las diferencias y similitudes entre  objetos para variables cuantitativas sobre las variantes tres y cuatro, se us&oacute;  la distancia <em>Eucl&iacute;dea</em> de la funci&oacute;n <em>dist</em>() descrita en el Paquete <em>stats</em>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el an&aacute;lisis de las cuatro  variantes combinatorias de datos se usaron datos procedentes de un estudio de  los diferentes genotipos de las colecciones de &ntilde;ame (<em>Dioscorea</em> spp.), malanga (<em>Xanthosoma</em> spp.) y pl&aacute;tanos (<em>Musa</em> spp.)&nbsp; que se conserva en el Instituto de  Investigaciones de Viandas Tropicales (INIVIT).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En esta investigaci&oacute;n se usaron los  m&eacute;todos de aglomeraci&oacute;n jer&aacute;rquicos de Ward o varianza m&iacute;nima  (<em>Minimum Variance Clustering </em>&nbsp;(Ward, 1963), Promedio &oacute; UPGMA <em>(Unweighted Pair-Group Method using  Arithmetic Averages</em>) (Sneath y Sokal, 1973), agrupaci&oacute;n de enlace simple (<em>Single Linkage Agglomerative Clustering</em>)(Gower, 1967), agrupaci&oacute;n de enlace completo (<em>Complete Linkage Agglomerative Clustering</em>)  (Sorensen, 1948) con la funci&oacute;n <em>hclust</em>()&nbsp; en el paquete <em>stats</em> que forma parte de &nbsp;los paquetes de R que se instalan por defecto.  Tambi&eacute;n se encuentra el paquete <em>cluster</em>&nbsp; (Maechler et al., 2005) que ampl&iacute;a la gama de an&aacute;lisis de  conglomerados, pues incluye adem&aacute;s&nbsp;  m&eacute;todos particionales.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la  b&uacute;squeda de mejores algoritmos de clasificaci&oacute;n aparece una tendencia a  combinar varios algoritmos de agrupamiento en el mismo problema. La base de  estos algoritmos est&aacute; en la l&oacute;gica de utilizar el criterio de varios expertos y  combinarlos en aras de lograr un mejor rendimiento.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El paquete <em>clue </em>(Hornik,  2017) permite  crear y analizar combinaci&oacute;n de agrupamientos, para ambas representaciones de  los datos: jer&aacute;rquica y no jer&aacute;rquica y obtener una estructura consenso. Para  aglutinar los resultados de los diferentes algoritmos de aglomeraci&oacute;n se us&oacute; la  funci&oacute;n <em>cl_ensemble</em>() de este  paquete, en aras de lograr una mejor calidad de los resultados alcanzados por  los algoritmos individuales y compensar posibles errores cometidos en el  desempe&ntilde;o de cada uno. El &aacute;rbol consenso, resultado de combinar toda la  informaci&oacute;n de los diferentes &aacute;rboles en un dendrograma final, se obtuvo en dos  variantes, utilizando las distancias <em>Euclidean,  Manhattan </em>y <em>Majority </em>disponibles  en esta funci&oacute;n para los algoritmos jer&aacute;rquicos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Al  finalizar cada an&aacute;lisis multivariado, se ofrece la posibilidad de salvar los  resultados en un fichero de datos, que puede ser posteriormente cargado y  utilizado en procesamientos posteriores.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">De esta forma, los curadores  cuentan con una herramienta inform&aacute;tica que les ayuda a escoger la mejor  variante de procesamiento, sin necesidad de poseer amplios conocimientos, ni en  las t&eacute;cnicas estad&iacute;sticas ni en las computacionales. Lo que anteriormente  pod&iacute;an hacer mediante varios programas estad&iacute;sticos espec&iacute;ficos por separado y  dominando a fondo c&oacute;mo manipular los datos, c&oacute;mo trabajar con un <em>software</em> para profesionales en  estad&iacute;stica e interpretar los resultados, ahora se encuentra aglutinado en uno  solo, que adem&aacute;s les brinda una metodolog&iacute;a de desarrollo de los an&aacute;lisis y les  facilita la comprensi&oacute;n. Esto debe ser altamente apreciado debido a que les  ahorra tiempo en el procesamiento estad&iacute;stico y brinda mayor visi&oacute;n y  fiabilidad en los resultados obtenidos. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se obtuvo una aplicaci&oacute;n inform&aacute;tica  que permite la obtenci&oacute;n y manipulaci&oacute;n de datos, la definici&oacute;n del nivel de  medici&oacute;n de las variables y la ejecuci&oacute;n de m&eacute;todos multivariados de reducci&oacute;n  de datos y clasificaci&oacute;n. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La combinaci&oacute;n de las t&eacute;cnicas  estad&iacute;sticas empleadas en las cuatro variantes combinatorias de datos, por su  flexibilidad, pueden ser aplicadas a otros estudios de clasificaci&oacute;n en bancos  de germoplasma vegetal.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La aplicaci&oacute;n inform&aacute;tica es un <em>software</em> libre, lo cual ampl&iacute;a  grandemente sus posibilidades de acceso y distribuci&oacute;n. </font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS  BIBLIOGR&Aacute;FICAS</B></font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BERNAARDS, C. A. y ROBERT I. J. Gradient  Projection Algorithms and Software for Arbitrary Rotation Criteria in Factor  Analysis. Educational and  Psychological Measurement, 2005, 65: 676&ndash;96.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BRAMARDI, S. J. An&aacute;lisis Multivariado.  Su Aplicaci&oacute;n En La Caracterizaci&oacute;n de Recursos Gen&eacute;ticos. Facultad de Ciencias Agrarias, Univ.  Conahue, Estaci&oacute;n Exp. INTA. Argentina, 2002, 60.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">FRANCO, T. L. y HIDALGO,  R. An&aacute;lisis Estad&iacute;stico de Datos de  Caracterizaci&oacute;n Morfol&oacute;gica de Recursos Fitogen&eacute;ticos. Bolet&iacute;n T&eacute;cnico  IPGRI 8. Cali, Colombia: Instituto Internacional de Recursos Fitogen&eacute;ticos  (IPGRI). 2003. 89p.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GOWER, J. C. AGeneral Coefficient of Similarity and Some of Its Properties. Biometrics, 1971, 27: 857&ndash;71.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GOWER, J. C. AComparison of Some Methods of Cluster Analysis. Biometrics, 1967, 23: 623&ndash;28.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GROSJEAN, P. SciViews: A GUI API for R. Belgium: UMONS, 2012. Fecha de  consulta: 12 de abril 2017, Disponible en:  https://cran.r-project.org/web/packages/tcltk2/index.html.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HAIR, J. F.; ANDERSON, R. E.; TATHAM, R.L. y BLACK,  W.C. Multivariate Data Analysis.  Nueva York: MacMillan Publ. Co. 1992,544p</font><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HORNIK, K. &ldquo;Clue: Cluster Ensembles. R  Package Version 0.3-53.&rdquo; 2017. Fecha de consulta: 17 de febrero 2017,  Disponible en: https://CRAN.R-project.org/package=clue.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SEBASTIEN, L.; JOSSE, J. y HUSSON, F.  FactoMineR: An R Package for Multivariate Analysis. Journal of Statistical  Software, 2008, 25(1), 1-18. DOI:10.18637/jss.v025.i01.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">IHAKA, R. y GENTLEMAN, R. R: A Language for  Data Analysis and Graphic<em>s</em>. Journal of Computational and Graphical  Statistics<em>,</em> 1996, 5: 299&ndash;314.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LALIBERT&Eacute;, E. y LEGENDRE, P. A distance-based  framework for measuring functional diversity from multiple traits. Ecology,  2010, 91:299-305.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LALIBERT&Eacute;, E.; LEGENDRE, P.&nbsp; y SHIPLEY, B. <em>FD: </em>Measuring Functional Diversity from Multiple Traits, and Other  Tools for Functional Ecology. R Package Version 1.0-12. 2015. Fecha de  consulta: 22 diciembre de 2016, Disponible en:  https://cran.r-project.org/web/packages/FD/FD.pdf.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MAECHLER, M.; ROUSSEEUW, P.; STRUYF, A.; HUBERT,  M. y HORNIK, K. Cluster: Cluster Analysis Basics and Extensions. R  Package Version 2.0.6.2017. Fecha de consulta: 27 marzo de 2017, Disponible en:  https://cran.r-project.org/web/packages/cluster/index.html.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MILLIGAN, G W. y COOPER, M. C. A Study of  Standardization of Variables in Cluster Analysis. Journal of Classification, 1988,5: 181&ndash;204.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">R DEVELOPMENT CORE TEAM. Contributed Packages. 2017a. Fecha  de consulta: 17 junio de 2017, Disponible en: https://cran.r-project.org.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">R DEVELOPMENT CORE TEAM.&nbsp; R: A  Language and Environment for Statistical Computing (version 3.4.0). R  Foundation for Statistical Computing. Vienna, Austria. 2017b. Fecha de  consulta: 7 abril de 2017, Disponible en: http://www.r-project.org/.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">RIPLEY, B. y LAPSLEY, M. RODBC:  ODBC Database Access. 2017. Fecha de consulta: 23 de mayo 2017, Disponible en:  https://cran.r-project.org/web/packages/RODBC/RODBC.pdf.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Salas, C. &iquest;Por Qu&eacute; Comprar  Un Programa Estad&iacute;stico Si Existe R?,Ecolog&iacute;a Austra<em>l</em>, 2008, Vol.  18: 223&ndash;31.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SNEATH, P.H. A. y SOKAL, R. R. Numerical Taxonomy. The Principles and  Practice of Numerical Classification. 1973. San Francisco,  California, USA: W. H. Freeman and Co.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SORENSEN, T. A. AMethod of Establishing Groups of Equal Amplitude in Plant Sociology  Based on Similarity of Species Content and Its Application to Alalysies of  Vegetation on Danish Commons. Biologiske  Skrifter<em>,</em> 1948, 5: 1&ndash;34.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">STUDER, M. Excel Connector  for R. 2017. Fecha de consulta: 23 de mayo 2017, Disponible en:  https://cran.r-project.org/web/packages/XLConnect/index.html.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">TENENHAUS, M. y YOUNG, F.W.&nbsp; An Analysis and Synthesis of Multiple  Correspondence Analysis, Optimal Scaling, Dual Scaling, Homogeneity Analysis  and Other Methods for Quantifying Categorical Multivariate Data.Psychometrika,  1985, 50(91). doi:10.1007/BF02294151.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WALESIAK, M. y DUDEK, A. clusterSim: Searching for Optimal Clustering  Procedure for a Data set. 2017. Fecha de consulta: 3 de abril  2017, Disponible en: http://cran.es.r-project.org/web/packages/clusterSim/clusterSim.pdf.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WARD,  J.H. Jr. Hierarchical Grouping to Optimize an Objective Function. Journal of the American Statistical  Association<em>,</em> 1963, 58: 236&ndash;44. </font></p>     <p name="_ENREF_1">&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 20/05/2017    <br> Aceptado: 25/06/2017</font></p>     ]]></body>
<body><![CDATA[ ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BERNAARDS]]></surname>
<given-names><![CDATA[C. A]]></given-names>
</name>
<name>
<surname><![CDATA[ROBERT I]]></surname>
<given-names><![CDATA[. J]]></given-names>
</name>
</person-group>
<source><![CDATA[Gradient Projection Algorithms and Software for Arbitrary Rotation Criteria in Factor Analysis]]></source>
<year>2005</year>
<volume>65</volume>
<page-range>676-96</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BRAMARDI]]></surname>
<given-names><![CDATA[S. J]]></given-names>
</name>
</person-group>
<source><![CDATA[Análisis Multivariado]]></source>
<year>2002</year>
<page-range>60</page-range><publisher-name><![CDATA[Facultad de Ciencias Agrarias, Univ. Conahue]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FRANCO]]></surname>
<given-names><![CDATA[T. L]]></given-names>
</name>
<name>
<surname><![CDATA[HIDALGO]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Análisis Estadístico de Datos de Caracterización Morfológica de Recursos Fitogenéticos]]></source>
<year>2003</year>
<page-range>89p</page-range><publisher-loc><![CDATA[^eCali Cali]]></publisher-loc>
<publisher-name><![CDATA[Instituto Internacional de Recursos Fitogenéticos (IPGRI).]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GOWER]]></surname>
<given-names><![CDATA[J. C]]></given-names>
</name>
</person-group>
<source><![CDATA[AGeneral Coefficient of Similarity and Some of Its Properties]]></source>
<year>1971</year>
<volume>27</volume>
<page-range>857-71</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GOWER]]></surname>
<given-names><![CDATA[J. C]]></given-names>
</name>
</person-group>
<source><![CDATA[AComparison of Some Methods of Cluster Analysis]]></source>
<year>1967</year>
<volume>23</volume>
<page-range>623-28</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GROSJEAN]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[SciViews: A GUI API for R. Belgium]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HAIR]]></surname>
<given-names><![CDATA[J. F]]></given-names>
</name>
<name>
<surname><![CDATA[ANDERSON]]></surname>
<given-names><![CDATA[R. E]]></given-names>
</name>
<name>
<surname><![CDATA[TATHAM]]></surname>
<given-names><![CDATA[R.L]]></given-names>
</name>
<name>
<surname><![CDATA[BLACK]]></surname>
<given-names><![CDATA[W.C]]></given-names>
</name>
</person-group>
<source><![CDATA[Multivariate Data Analysis.]]></source>
<year>1992</year>
<page-range>544p</page-range><publisher-loc><![CDATA[^eNueva York Nueva York]]></publisher-loc>
<publisher-name><![CDATA[MacMillan Publ. Co]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HORNIK]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[Clue: Cluster Ensembles]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SEBASTIEN]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[JOSSE]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[HUSSON]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[FactoMineR: An R Package for Multivariate Analysis]]></article-title>
<source><![CDATA[]]></source>
<year>2008</year>
<volume>25</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1-18</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[IHAKA]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[GENTLEMAN]]></surname>
<given-names><![CDATA[R. R]]></given-names>
</name>
</person-group>
<source><![CDATA[A Language for Data Analysis and Graphics]]></source>
<year>1996</year>
<volume>5</volume>
<page-range>299-314</page-range><publisher-name><![CDATA[Journal of Computational and Graphical Statistics]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LALIBERTÉ]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[LEGENDRE]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[A distance-based framework for measuring functional diversity from multiple traits]]></source>
<year>2010</year>
<volume>91</volume>
<page-range>299-305</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LALIBERTÉ]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[LEGENDRE]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[SHIPLEY]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<source><![CDATA[FD: Measuring Functional Diversity from Multiple Traits, and Other Tools for Functional Ecology.]]></source>
<year>2015</year>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MAECHLER]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[ROUSSEEUW]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[STRUYF]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[HUBERT]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[HORNIK]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[Cluster: Cluster Analysis Basics and Extensions.]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MILLIGAN]]></surname>
<given-names><![CDATA[G W]]></given-names>
</name>
<name>
<surname><![CDATA[COOPER]]></surname>
<given-names><![CDATA[M. C]]></given-names>
</name>
</person-group>
<source><![CDATA[A Study of Standardization of Variables in Cluster Analysis]]></source>
<year>1988</year>
<volume>5</volume>
<page-range>181-204</page-range><publisher-name><![CDATA[Journal of Classification]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<collab>R DEVELOPMENT CORE TEAM</collab>
<source><![CDATA[Contributed Packages]]></source>
<year>2017</year>
<month>a</month>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="">
<collab>R DEVELOPMENT CORE TEAM</collab>
<source><![CDATA[R: A Language and Environment for Statistical Computing (version 3.4.0).]]></source>
<year>2017</year>
<month>b</month>
<publisher-loc><![CDATA[^eVienna Vienna]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RIPLEY]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[LAPSLEY]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[RODBC: ODBC Database Access]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salas]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[¿Por Qué Comprar Un Programa Estadístico Si Existe R?,]]></source>
<year>2008</year>
<volume>Vol. 18</volume>
<page-range>223-31</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SNEATH]]></surname>
<given-names><![CDATA[P.H. A]]></given-names>
</name>
<name>
<surname><![CDATA[SOKAL]]></surname>
<given-names><![CDATA[R. R]]></given-names>
</name>
</person-group>
<source><![CDATA[Numerical Taxonomy]]></source>
<year>1973</year>
<publisher-loc><![CDATA[^eSan Francisco, California San Francisco, California]]></publisher-loc>
<publisher-name><![CDATA[W. H. Freeman and Co]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SORENSEN]]></surname>
<given-names><![CDATA[T. A]]></given-names>
</name>
</person-group>
<source><![CDATA[AMethod of Establishing Groups of Equal Amplitude in Plant Sociology Based on Similarity of Species Content and Its Application to Alalysies of Vegetation on Danish Commons]]></source>
<year>1948</year>
<volume>5</volume>
<page-range>1-34</page-range><publisher-name><![CDATA[Biologiske Skrifter]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[STUDER]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Excel Connector for R.]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TENENHAUS]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[YOUNG]]></surname>
<given-names><![CDATA[F.W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Analysis and Synthesis of Multiple Correspondence Analysis, Optimal Scaling]]></article-title>
<source><![CDATA[]]></source>
<year>1985</year>
<volume>50</volume>
<numero>91</numero>
<issue>91</issue>
</nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WALESIAK]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[DUDEK]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[clusterSim: Searching for Optimal Clustering Procedure for a Data set]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WARD]]></surname>
<given-names><![CDATA[J.H. Jr]]></given-names>
</name>
</person-group>
<source><![CDATA[Hierarchical Grouping to Optimize an Objective Function]]></source>
<year>1963</year>
<volume>58</volume>
<page-range>236-44.</page-range><publisher-name><![CDATA[Journal of the American Statistical Association]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
