<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000300005</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Determinación heurística de las relaciones entre las estructuras y la producción de metabolitos secundarios]]></article-title>
<article-title xml:lang="en"><![CDATA[Heuristic determination of relations between the structures and the production of secondary metabolites]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[García Brizuela]]></surname>
<given-names><![CDATA[Jorge]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Santiesteban-Toca]]></surname>
<given-names><![CDATA[Cosme E.]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Capdesuñer Ruíz]]></surname>
<given-names><![CDATA[Yanelis]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Máximo Gomes Báez Centro de Bioplantas ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Máximo Gomes Báez Centro de Bioplantas ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>3</numero>
<fpage>50</fpage>
<lpage>63</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000300005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000300005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000300005&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN El cultivo y producción del tabaco (nicotiana tabacum), es altamente dependiente de los plaguicidas. La aplicación de plaguicidas a menudo no es eficaz y es peligrosa para los seres humanos y el medio ambiente. Sin embargo, es bien conocido que algunos metabolitos secundarios juegan un papel esencial en la protección de plantas contra patógenos. Sin embargo, establecer la relación entre la producción de metabolitos secundarios y los rasgos fenotípicos requiere una amplia experimentación y el seguimiento de la información manual. Además, desde el perfil fenotípico de una planta determinada podemos derivar la producción de determinados productos naturales, pero es imposible deducir el perfil fenotípico de las plantas en función de sus productos naturales. Por esta razón, el objetivo de esta investigación es diseñar un método basado en técnicas de aprendizaje automático, entrenado con los rasgos fenotípicos (morfología del tricomas) de las plantas, que sea capaz de aprender la correlación existente entre los rasgos fenotípicos y los metabolitos secundarios de las plantas de nicotiana tabacum. La búsqueda de la relación de los metabolitos con el nivel de expresión de un rasgo dado es un problema de regresión. Por lo que fueron empleados un grupo de técnicas de regresión basadas en estadígrafos tradicionales y técnicas de aprendizaje automático. Como resultado de la experimentación, se determinó que el empleo de un árbol de regresión REPTree permite determinar los rasgos que mejor correlacionan con el metabolito estudiado. Además, como valor agregado, es capaz de devolver un conjunto de reglas simples que describen este proceso.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT The tobacco culture and production, especially in tropical countries, is highly dependent of pesticides. But, the application of pesticides is often ineffective and dangerous to the humans and the environment. Moreover, it is well known that some secondary metabolites play an essential role in the protection of plants against pathogens. However, establishing the relationship between the production of secondary metabolites and the phonotypical traits requires an extensive experimentation and manual tracking information. Moreover, from the metabolite profile of a particular plant we can derive its biological activity, but it is impossible to deduce the exact metabolic profile of plants according to their biological activity. Therefore, the objective of this research is to design a method based on machine learning techniques, trained on the plants phenotypic profile, which is able to learn the correlation between the secondary metabolites and phenotypic traits of tobacco plants. Finding the relationship between phenotypes and the expression level of a given metabolite, is a regression problem. For this reason, some traditional statistics techniques and machine learning techniques were employed. As a result of experimentation, it was determined that the use of a REPTree regression tree, determines the characteristics that best correlate with the studied metabolite. Also, as an added value, it is able to return a set of simple rules that describe this process.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[regresión]]></kwd>
<kwd lng="es"><![CDATA[metabolitos]]></kwd>
<kwd lng="es"><![CDATA[correlación]]></kwd>
<kwd lng="es"><![CDATA[fenotipos]]></kwd>
<kwd lng="en"><![CDATA[correlation]]></kwd>
<kwd lng="en"><![CDATA[metabolites]]></kwd>
<kwd lng="en"><![CDATA[phenotypes]]></kwd>
<kwd lng="en"><![CDATA[regression]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Determinaci&oacute;n heur&iacute;stica de las relaciones  entre las estructuras y la producci&oacute;n de metabolitos secundarios</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><em><font face="Verdana, Arial, Helvetica, sans-serif">Heuristic determination of relations between the structures and the  production of secondary metabolites</font></em></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Jorge  Garc&iacute;a Brizuela<strong><sup>1*</sup></strong>, Cosme E. Santiesteban-Toca<strong><sup>1</sup></strong>, Yanelis  Capdesu&ntilde;er Ru&iacute;z</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup></strong></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Centro de Bioplantas, &ldquo;Universidad M&aacute;ximo Gomes B&aacute;ez&rdquo;,  Ciego de &Aacute;vila, Cuba, Carretera a Mor&oacute;n, Km 9&frac12;. CP: 69150. {jorgito,cosme}@bioplantas.cu </font><font size="2" face="Verdana, Arial, Helvetica, sans-serif">    <br>     <sup>2</sup>Centro de Bioplantas, &ldquo;Universidad M&aacute;ximo G&oacute;mez B&aacute;ez&rdquo;,  Ciego de &Aacute;vila, Cuba, Carretera a Mor&oacute;n, Km 9&frac12;. CP. 69150. <a href="mailto:ycapdesu&ntilde;er@bioplantas.cu">ycapdesu&ntilde;er@bioplantas.cu</a>    ]]></body>
<body><![CDATA[<br> </font></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:jorgito@bioplantas.cu">jorgito@bioplantas.cu</a><a href="mailto:liuben@bioplantas.cu"></a><a href="mailto:jova@uci.cu"></a></font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:losorio@ismm.edu.cu"></a> </font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El cultivo y producci&oacute;n del tabaco (nicotiana tabacum), es altamente  dependiente de los plaguicidas. La aplicaci&oacute;n de plaguicidas a menudo no es  eficaz y es peligrosa para los seres humanos y el medio ambiente. Sin embargo,  es bien conocido que algunos metabolitos secundarios juegan un papel esencial  en la protecci&oacute;n de plantas contra pat&oacute;genos. Sin embargo, establecer la  relaci&oacute;n entre la producci&oacute;n de metabolitos secundarios y los rasgos  fenot&iacute;picos requiere una amplia experimentaci&oacute;n y el seguimiento de la  informaci&oacute;n manual. Adem&aacute;s, desde el perfil fenot&iacute;pico de una planta  determinada podemos derivar la producci&oacute;n de determinados productos naturales,  pero es imposible deducir el perfil fenot&iacute;pico de las plantas en funci&oacute;n de sus  productos naturales. Por esta raz&oacute;n, el objetivo de esta investigaci&oacute;n es dise&ntilde;ar  un m&eacute;todo basado en t&eacute;cnicas de aprendizaje autom&aacute;tico, entrenado con los  rasgos fenot&iacute;picos (morfolog&iacute;a del tricomas) de las plantas, que sea capaz de  aprender la correlaci&oacute;n existente entre los rasgos fenot&iacute;picos y los  metabolitos secundarios de las plantas de nicotiana tabacum. La b&uacute;squeda de la  relaci&oacute;n de los metabolitos con el nivel de expresi&oacute;n de un rasgo dado es un  problema de regresi&oacute;n. Por lo que fueron empleados un grupo de t&eacute;cnicas de  regresi&oacute;n basadas en estad&iacute;grafos tradicionales y t&eacute;cnicas de aprendizaje  autom&aacute;tico. Como resultado de la experimentaci&oacute;n, se determin&oacute; que el empleo de  un &aacute;rbol de regresi&oacute;n REPTree permite determinar los rasgos que mejor  correlacionan con el metabolito estudiado. Adem&aacute;s, como valor agregado, es  capaz de devolver un conjunto de reglas simples que describen este proceso.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">regresi&oacute;n, metabolitos, correlaci&oacute;n, fenotipos. </font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">The tobacco culture and production, especially  in tropical countries, is highly dependent of pesticides. But, the application  of pesticides is often ineffective and dangerous to the humans and the  environment. Moreover, it is well known that some secondary metabolites play an  essential role in the protection of plants against pathogens. However,  establishing the relationship between the production of secondary metabolites  and the phonotypical traits requires an extensive experimentation and manual  tracking information. Moreover, from the metabolite profile of a particular  plant we can derive its biological activity, but it is impossible to deduce the  exact metabolic profile of plants according to their biological activity.  Therefore, the objective of this research is to design a method based on  machine learning techniques, trained on the plants phenotypic profile, which is  able to learn the correlation between the secondary metabolites and phenotypic  traits of tobacco plants. Finding the relationship between phenotypes and the  expression level of a given metabolite, is a regression problem. For this reason,  some traditional statistics techniques and machine learning techniques were  employed. As a result of experimentation, it was determined that the use of a  REPTree regression tree, determines the characteristics that best correlate  with the studied metabolite. Also, as an added value, it is able to return a  set of simple rules that describe this process.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>correlation, metabolites, phenotypes, regression.</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En su h&aacute;bitat natural las plantas deben enfrentar y  protegerse de m&uacute;ltiples enemigos reales y potenciales, tales como plantas que  crecen en su entorno, microorganismos que provocan enfermedades, insectos,  entre otros. Adem&aacute;s, deben competir con el resto de las plantas en su medio por  agua, luz y nutrientes del suelo, entre otros tipos de estr&eacute;s bi&oacute;ticos y  abi&oacute;ticos (Bartwal et al. 2013).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En los organismos, el conjunto de reacciones  qu&iacute;micas que tienen lugar constituyen el metabolismo. Donde, los metabolitos  primarios est&aacute;n presentes en todas las plantas y desempe&ntilde;an funciones  similares. Mientras que los metabolitos secundarios son aquellos que no parecen  tener una funci&oacute;n directa en procesos fotosint&eacute;ticos, respiratorios, entre  otros, a los que tambi&eacute;n se denominan productos secundarios o productos  naturales (Maag et al. 2015).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Estos metabolitos secundarios, adem&aacute;s de no  presentar una funci&oacute;n definida en los procesos mencionados, difieren tambi&eacute;n de  los metabolitos primarios ya que no todos se encuentran en todos los grupos de  plantas y se sintetizan en peque&ntilde;as cantidades y no de forma generalizada,  restringi&eacute;ndose a un determinado g&eacute;nero de plantas, familia, o especies.    <br>   Algunos productos del metabolismo secundario tienen  funciones ecol&oacute;gicas espec&iacute;ficas como atrayentes o repelentes de animales.  Tambi&eacute;n intervienen en los mecanismos de defensa de las plantas frente a  diferentes pat&oacute;genos, actuando como pesticidas naturales (Moore et al. 2014).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Sin embargo, establecer la relaci&oacute;n que existe entre  la producci&oacute;n de productos naturales, las estructuras morfol&oacute;gicas implicadas  en el proceso y la actividad biol&oacute;gica, es una tarea que exige una extensiva  experimentaci&oacute;n y procesamiento de informaci&oacute;n, que hasta la actualidad se  realiza de forma manual.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Esto se debe, en lo fundamental, a que de una  estructura determinada se puede llegar a un metabolito y/o actividad biol&oacute;gica,  sin embargo, a esa misma actividad biol&oacute;gica se puede llegar desde diferentes  estructuras.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La no existencia de una correspondencia directa y bidireccional  implica que no se puede establecer con facilidad la relaci&oacute;n que existe entre  estructuras, metabolitos secundarios y actividad biol&oacute;gica (Maag et al. 2015).</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como estructuras se refiere a los pelos llamados  tricomas por los que est&aacute;n cubiertas la mayor&iacute;a de las plantas. Los tricomas  son reconocidos dentro de las caracter&iacute;sticas anat&oacute;micas de las plantas o  fenotipos (Kortbeek et al. 2016) y juegan un  papel clave en la taxonom&iacute;a de las plantas, se han definido como protuberancias  epid&eacute;rmicas que se distinguen por su tama&ntilde;o y forma para su clasificaci&oacute;n en  diferentes tipos. Los tricomas se clasifican en dos grandes tipos: Tricomas no  Glandulares o simples y tricomas Glandulares. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la actualidad existen  deficiencias en las t&eacute;cnicas para predecir la relaci&oacute;n existente entre los  rasgos fenot&iacute;picos y los metabolitos secundarios. El objetivo de la  investigaci&oacute;n es dise&ntilde;ar un m&eacute;todo, basado en t&eacute;cnicas de aprendizaje  autom&aacute;tico y entrenado en el perfil fenot&iacute;pico de las plantas, que sea capaz de  aprender la correlaci&oacute;n existente entre las estructuras y los productos  naturales de las plantas de nicotiana tabacum. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">M&eacute;todos de selecci&oacute;n de atributos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El proceso de selecci&oacute;n  de rasgos consta de dos componentes principales: una funci&oacute;n de evaluaci&oacute;n y un  m&eacute;todo de b&uacute;squeda (<a href="/img/revistas/rcci/v11n3/f0105217.jpg" target="_blank">Figura 1</a>). La funci&oacute;n de evaluaci&oacute;n permite calcular la  calidad de un subconjunto de rasgos; mientras que el m&eacute;todo de b&uacute;squeda, por lo  general heur&iacute;stica, es el encargado de generar los subconjuntos de rasgos.  Seleccionar los rasgos relevantes de un conjunto de datos es una tarea  necesaria en el aprendizaje automatizado (<em>machine  learning</em>), dada su importancia en el descubrimiento de reglas y relaciones  en grandes vol&uacute;menes de datos entre otras aplicaciones (Wang  et al. 2014).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo &quot;<strong><em>CfsSubsetEval</em></strong>&quot; (CSE), calcula  la correlaci&oacute;n de la clase con cada atributo, y eliminan atributos que tienen  una correlaci&oacute;n muy alta como atributos redundantes. Los subconjuntos de  caracter&iacute;sticas que est&aacute;n altamente correlacionadas con la clase al tener  inter-correlaci&oacute;n baja son preferidos (Park  and Hong 2014).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En cuanto al m&eacute;todo de b&uacute;squeda, vamos a mencionar el &quot;<strong><em>BestFirst</em></strong>&quot;  (BF), que recorre el espacio de subconjuntos de atributos por medio del m&eacute;todo  escalador de monta&ntilde;a &aacute;vido, engrandecido con una facilidad que vuelve hacia  atr&aacute;s (backtracking). El  m&eacute;todo &quot;<strong><em>GeneticSearch</em></strong>&quot; (GS) realiza  una b&uacute;squeda usando el simple algoritmo gen&eacute;tico descrito en (De&rsquo;ath 2007).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>T&eacute;cnicas de predicci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los algoritmos <strong>supervisados o predictivos</strong> predicen  el valor de un atributo (clase) de un conjunto de datos, conocidos otros  atributos (rasgos). A partir de datos cuya clase se conoce, por tanto, se  induce una relaci&oacute;n entre dicha clase y los rasgos, el cual se desarrolla en  dos fases:</font></p>     ]]></body>
<body><![CDATA[<p> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Entrenamiento (construcci&oacute;n de un modelo usando un  subconjunto de datos con clase conocida) y prueba (prueba del modelo sobre el  resto de los datos). Existen  diferentes tipos de algoritmos de aprendizaje autom&aacute;tico. El algoritmo <strong>LinearRegression </strong>(LR)<strong> e</strong>s el m&aacute;s sencillo para hacer  predicci&oacute;n realizando regresi&oacute;n lineal. Usa como criterio de selecci&oacute;n del  modelo Akaike(Akaike 1974), y puede manejar datos  incompletos. El <strong>DecisionTable (</strong>DT) es un algoritmo que m&aacute;s que un &aacute;rbol,  la tabla de decisi&oacute;n es una matriz de filas y columnas que indican condiciones  y acciones. Las reglas de decisi&oacute;n, incluidas en una tabla de decisi&oacute;n,  establecen el procedimiento a seguir cuando existen ciertas condiciones. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo <strong>M5P </strong>se basa en &aacute;rboles de decisi&oacute;n, sin  embargo, en lugar de tener valores en los nodos de &aacute;rbol, contiene un modelo  lineal multi-variable de regresi&oacute;n en cada nodo. El espacio de entrada est&aacute; dividido  en celdas de entrenamiento de datos y sus salidas, luego se crea un modelo de  regresi&oacute;n en cada celda como una hoja del &aacute;rbol(Quinlan 1992). El <strong>M5R </strong>genera una lista de  decisiones para los problemas de regresi&oacute;n usando el paradigma divide y  vencer&aacute;s. En cada iteraci&oacute;n construye un &aacute;rbol modelo utilizando el algoritmo  M5 y convierte la mejor hoja en una regla (Azofra et al. 2015). Este algoritmo tiene el mismo principio de funcionamiento que el M5P. Lo  que, en vez de construir un modelo en forma de &aacute;rbol, describe reglas. Pese a  su funcionamiento muy parecido, devuelve resultados muy semejantes, pero nunca  iguales.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El <strong>REPTree </strong>(RT) es un m&eacute;todo de aprendizaje r&aacute;pido  mediante &aacute;rboles de decisi&oacute;n. Construye un &aacute;rbol de decisi&oacute;n usando la  informaci&oacute;n de varianza y lo poda usando como criterio la reducci&oacute;n del error.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Solamente clasifica valores para atributos num&eacute;ricos una vez. Los valores  ausentes se manejan dividiendo las instancias correspondientes en segmentos. Es  un &aacute;rbol de clasificaci&oacute;n con modelo comprensible (reglas <em>if then else</em>) (Jung, Kang, and Choi 2016).</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Herramienta utilizada</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La herramienta utilizada en  la investigaci&oacute;n es la plataforma experimental Weka (<em>Waikato Environment for Knowledge Analysis,</em> Entorno para An&aacute;lisis  del Conocimiento de la Universidad de Waikato). Es una  plataforma de software para resolver problemas de aprendizaje autom&aacute;tico y  miner&iacute;a de datos. Es escrito en Java y desarrollado en la Universidad de  Waikato. Weka es un software libre distribuido bajo licencia GNU-GPL </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Preparaci&oacute;n de la muestra y procedimiento  de cuantificaci&oacute;n:</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Material  vegetal: Para el estudio de la morfolog&iacute;a de los tricomas se tomaron como  muestra 2 hojas (Hoja joven completamente desplegada de aproximadamente 15 a 18  cm de largo en la segunda posici&oacute;n en el tallo despu&eacute;s de las hojas peque&ntilde;as en  formaci&oacute;n, Figura ) de cada  planta por l&iacute;nea de cultivo, de las 8 l&iacute;neas de cultivo de <em>nicotiana tabacum</em> empleadas para la extracci&oacute;n del material  vegetal. Las plantas utilizadas para la investigaci&oacute;n en el momento de  extracci&oacute;n de las muestras ten&iacute;an 3 meses de edad crecidas en condiciones de  campo. De ellas se realizaron preparaciones fijas para observar y fotografiar  en el microscopio electr&oacute;nico de forma tal que se obtuvieron un total de 9  im&aacute;genes de diferentes zonas del haz y 9 im&aacute;genes de diferentes zonas del env&eacute;s  por l&iacute;nea. </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Clasificaci&oacute;n de los tipos encontrados:</font></strong> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se clasificaron los tricomas glandulares seg&uacute;n la  clasificaci&oacute;n establecida en <em>nicotiana  tabacum </em>de dos tipos (Tipo I y Tipo II) pero adem&aacute;s se hicieron otras  clasificaciones seg&uacute;n la morfolog&iacute;a observada. La clasificaci&oacute;n se realiz&oacute;  manual para las 18 im&aacute;genes con colores definidos en Photoshop para cada tipo  de tricoma (<a href="/img/revistas/rcci/v11n3/f0205317.jpg" target="_blank">Figura 2</a> ).</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los Tipo  I G marcados en rojo son tallos largos pluricelulares y gl&aacute;ndula con un tama&ntilde;o  &ge;300 &micro;m, Tipo I R en Verde son tallos largos pluricelulares ramificados, Tipo I  P en Azul son tallos largos de pluricelulares generalmente peque&ntilde;os   con un tama&ntilde;o &#706; 300 &micro;m y Tipo II en Amarillo  identificados como tallos cortos de gl&aacute;ndulas esf&eacute;ricas uni o pluricelulares. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El conteo de  tricomas se realiz&oacute; con el empleo de un software desarrollado por el Doctor  Milton Garc&iacute;a del departamento de Bioinform&aacute;tica del Centro de Bioplantas para  el conteo por colores de tricomas, luego de su identificaci&oacute;n y clasificaci&oacute;n  previa con el empleo de Photoshop. Se eval&uacute;an las siguientes variables el total  de tricomas por l&iacute;nea, el total de tricomas en el haz, el total de tricomas en  el env&eacute;s, y el total de tricomas por tipo tanto en el haz como el env&eacute;s de la  hoja (<a href="/img/revistas/rcci/v11n3/f0305317.jpg" target="_blank">Figura 3</a> ).</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Bases  de datos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la  experimentaci&oacute;n en el m&eacute;todo a proponer, fueron empleados seis conjuntos de  datos, uno por cada producto natural:</font></p>     <p><img src="/img/revistas/rcci/v11n3/fo0105317.jpg" alt="fo01" width="284" height="94"> <img src="/img/revistas/rcci/v11n3/fo0205317.jpg" alt="fo02" width="267" height="85"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Cada conjunto  contiene 72 objetos y estos tienen quince diferentes mediciones de rasgos  fenot&iacute;picos y una clase. Las mediciones y la clase presentas datos num&eacute;ricos y  no presentan datos incompletos. Las  base de datos fueron codificadas en formato *.arff por su f&aacute;cil manejo y ser el  tipo de fichero de entrada por defecto de la plata<a name="_Toc421026659">forma  de experimentaci&oacute;n Weka. </a></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Codificaci&oacute;n  del vector de entrada</strong> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El vector de entrada es de longitud fija, incluye la  informaci&oacute;n de los rasgos fenot&iacute;picos (atributos) y la medici&oacute;n de un compuesto  (clase) de una planta. El vector de entrada contiene 15 rasgos y una clase. Los  rasgos se dividen en tres grupos de cinco. El grupo uno y dos corresponde al  haz y el env&eacute;s de la hoja respectivamente. En estos dos grupos cuatro de los  rasgos corresponde al conteo de un tipo de tricoma espec&iacute;fico, que es com&uacute;n en  el haz y el env&eacute;s, y el quinto rasgo es la suma de los cuatro anteriores.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el tercer grupo  los cuatro primeros atributos son el total de tricomas por tipos y el quinto  atributo es la suma de los totales de los dos grupos anteriores (<a href="#f04">Figura 4</a> ). La clase hace  referencia a la medici&oacute;n de uno de los metabolitos secundario estudiados. </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0405317.jpg" alt="f04" width="451" height="225"><a name="f04"></a></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La selecci&oacute;n de los rasgos  fenot&iacute;picos se realiz&oacute; empleando los m&eacute;todos de aprendizaje autom&aacute;tico <strong><em>&ldquo;CfsSubsetEval + BestFirst&rdquo;</em></strong> (CSE-Bf) <em>y <strong>&ldquo;CfsSubsetEval + GeneticSearch&rdquo; </strong></em>(CSE-Gs).Tanto CSE-Bf como CSE-Gs arrojaron la  misma selecci&oacute;n de rasgos para los seis conjuntos de datos empleados (<a href="#t01">Tabla  1</a>). </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/t0105317.jpg" alt="t01" width="565" height="214"><a name="t01"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como se pudo observar en la tabla los rasgos seleccionados  en su gran mayor&iacute;a pertenecen al env&eacute;s de la hoja de <em>nicotiana tabacum</em>. Tambi&eacute;n se aprecia que el rasgo <strong>&ldquo;Total  Tricomas Env&eacute;s&rdquo; </strong>fue elegido en 4 de los 6 conjuntos de datos. Estos resultados difieren por completo de los obtenidos por las  t&eacute;cnicas estad&iacute;sticas. Sin embargo, el alto nivel de correlaci&oacute;n y la inclusi&oacute;n  del nivel de expresi&oacute;n de los metabolitos estudiados en el modelo, dan cr&eacute;dito  a estos resultados. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Determinaci&oacute;n  de la relaci&oacute;n entre los rasgos y la producci&oacute;n de los metabolitos estudiados</strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para hacer el an&aacute;lisis de la relaci&oacute;n  rasgos-producci&oacute;n se emplearon los siguientes algoritmos de regresi&oacute;n: </font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>LR: </strong>este algoritmo fue configurado con un algoritmo goloso como m&eacute;todo de  selecci&oacute;n de atributos (<em>greedy</em>) y  valor de &nbsp;en la cordillera de selecci&oacute;n (&ldquo;-S 2 -R  1.0E-8&rdquo;).</font></p>   </li>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>DT: </strong>la configuraci&oacute;n para este  algoritmo se hizo aplic&aacute;ndole un valor de 1 en la validaci&oacute;n cruzada. Como  m&eacute;todo de selecci&oacute;n de atributos BF con sus valores por defecto (&ldquo;-X 1 -S  &quot;weka.attributeSelection.BestFirst -D 1 -N 5&rdquo;).</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>M5R y M5P: </strong>estos algoritmos fueron configurados para aceptar un  m&iacute;nimo de cuatro objetos por hojas (&quot;-M 4.0&quot;) </font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>RT: </strong>este &uacute;ltimo algoritmo fue configurado con un m&iacute;nimo de 2 objetos por  hoja, una varianza promedio m&iacute;nima de 0.001. Para la poda se especific&oacute; un  valor 5 particiones, para dar aleatoriedad agrego un 4 como valor en la semilla  y -1 como representaci&oacute;n de la no restricci&oacute;n en la profundidad del &aacute;rbol  construido (&ldquo;-M 2 -V 0.001 -N 5 -S 4 -L -1&rdquo;). </font></p>   </li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde, cada una de las configuraciones aplicadas a  estos fueron obtenidas a partir de un proceso de an&aacute;lisis de la bondad de  ajuste. Posteriormente, estos algoritmos fueron evaluados empleando un  procedimiento de validaci&oacute;n cruzada con 10 particiones. Los resultados experimentales se muestran en la <a href="/img/revistas/rcci/v11n3/t0205317.jpg" target="_blank">Tabla 2</a> , donde, cada algoritmo fue analizado para cada  conjunto de datos por separado. Tomando en cuenta como medida el CC para predecir  la relaci&oacute;n entre los rasgos fenot&iacute;picos y la producci&oacute;n de metabolitos  secundarios. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El an&aacute;lisis de esta tabla muestra el  comportamiento de los 5 algoritmos en los 6 conjuntos de datos. En general los  algoritmos RT, M5P y M5R muestran un comportamiento estable en los diferentes  conjuntos, superior a 0,75. El algoritmo RT fue el de mejor desempe&ntilde;o de todos  con valores entre 0,86 y 0,92. Los algoritmos LR y DT son los de menor  desempe&ntilde;o y mayor variaci&oacute;n en el CC, con valores que van desde 0,38 a 0,79 (<a href="/img/revistas/rcci/v11n3/f0505317.jpg" target="_blank">Figura 5</a>).</font></p>     <p>La figura afirma de  forma gr&aacute;fica la paridad entre RT, M5P y M5R. Evidenciando una ligera ventaja  de RT sobre M5P y M5R, respectivamente. Tras el an&aacute;lisis se aprecia que este  algoritmo presenta el mejor desempe&ntilde;o en 5 de las 6 bases de datos. Sin  embargo, estas valoraciones son muy dependientes de la escala, por lo que ser&aacute;  necesario aplicar y analizar los test significaci&oacute;n estad&iacute;stica en los  resultados. </p>     <p><font size="2"><a><strong><font face="Verdana, Arial, Helvetica, sans-serif">Aplicaci&oacute;n  de test estad&iacute;sticos</font></strong></a> </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Sin  embargo, el an&aacute;lisis de una gr&aacute;fica no resulta suficiente para poder determinar  si existen realmente diferencias en el comportamiento entre los algoritmos  analizados. Con el objetivo de poder refutar esta hip&oacute;tesis, resulta  aconsejable la consideraci&oacute;n de alg&uacute;n test estad&iacute;stico.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con el objetivo de  determinar si existen diferencias estad&iacute;sticamente significativas en los  resultados de los algoritmos para los diferentes conjuntos de datos, fueron  empleados m&uacute;ltiples pruebas estad&iacute;sticas no param&eacute;tricas. Mediante la prueba de  Friedman se comprueba la hip&oacute;tesis nula de que los algoritmos obtienen  resultados similares [15], como promedio, para todos los conjuntos. Al ser  rechazada la hip&oacute;tesis nula, entonces fueron aplicadas las pruebas de <em>post-hoc</em>: Bonferroni-Dunn, Holm,  Hochberg y Hommel. Para los niveles de significaci&oacute;n de 0.05 y 0,1 (<a href="/img/revistas/rcci/v11n3/t0305317.jpg" target="_blank">Tabla 3</a>).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El resultado de la  aplicaci&oacute;n del test de Friedman rechaza la hip&oacute;tesis nula, arrojando que si  existen diferencias estad&iacute;sticamente significativas. Primero el algoritmo RT  teniendo un comportamiento superior, seguido de M5R y M5P donde estos dos no  presentan diferencias significativas entre ellos. Por &uacute;ltimo, aparecen DT y LR  por ese orden respectivamente. En el aparecen  los resultados de los test estad&iacute;sticos en su totalidad para valores de  significaci&oacute;n de 0,05 y 0,10.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a><strong>Mecanismo  de interpretaci&oacute;n</strong></a> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo RT, al  estar basado en &aacute;rboles de regresi&oacute;n, tiene la habilidad de poseer un modelo de  conocimiento interpretable. Lo cual le proporciona una apreciable ventaja sobre  el resto de los algoritmos basados en redes neuronales, modelos probabil&iacute;sticos,  m&aacute;quinas de vectores soporte, entre otros. Debido a que las bases de  conocimientos de las redes neuronales son matrices de pesos o en las m&aacute;quinas  de soporte de vectores son matrices de vectores, las cuales no pueden ser  explicadas con facilidad por el bi&oacute;logo (usuario final). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como resultado final  se propone un &aacute;rbol de regresi&oacute;n (RT) por cada uno de los 6 conjuntos de datos.  Donde, cada hoja muestra la cantidad del metabolito a producir con un nivel de  confianza que est&aacute; en dependencia de la cantidad de veces que se observa el  patr&oacute;n. Cada &aacute;rbol se construye a partir de diferentes conjuntos de datos, lo  cual condiciona la diversidad entre ellos. Esto se puede apreciar en la <a href="#f06" target="_blank">Figura 6</a>, la cual muestra el &aacute;rbol de regresi&oacute;n construido  para el conjunto de datos Ds-ACd, pero solo con los rasgos fenot&iacute;picos  seleccionados por los algoritmos de selecci&oacute;n de atributos CSE-Gs y CSE-Bf (<a href="#t01">Tabla  1</a>).</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0605317.jpg" alt="f06" width="502" height="277"><a name="f06"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como se observa en la  figura el &aacute;rbol modelo describe la forma en que se comportar&aacute; la producci&oacute;n del  metabolito Ds-ACd a partir de los rasgos que mejor lo predicen, con una alta  confianza del 0,8612. El camino desde la ra&iacute;z a cada una de las 7 hojas ser&iacute;an  las reglas que describan dicha producci&oacute;n, como se muestra: </font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Si</em></strong> Total Tricomas Env&eacute;s <strong><em>&lt;</em></strong> 244,5 <strong>&rarr;</strong>Ds-ACd = 508</font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Si </em></strong>Total Tricomas Env&eacute;s <strong><em>&gt;=</em></strong> 244,5 <strong><em>y</em></strong> Tipo I G Haz <strong><em>&lt;</em></strong> 11,5 y Total Tricomas Env&eacute;s <strong><em>&lt;</em></strong> 347,5 <strong><em>y</em></strong> Tipo II Env&eacute;s <strong><em>&lt;</em></strong> 25,5 <strong>&rarr;</strong>Ds-ACd = 1299,67</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Si </em></strong>Total Tricomas Env&eacute;s <strong><em>&gt;=</em></strong> 244,5 <strong><em>y</em></strong> Tipo I G Haz <strong><em>&lt;</em></strong> 11,5 y Total Tricomas Env&eacute;s <strong><em>&lt;</em></strong> 347,5 <strong><em>y</em></strong> Tipo II Env&eacute;s <strong>&gt;=</strong> 25,5 <strong>&rarr;</strong>Ds-ACd = 1770</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Si </em></strong>Total Tricomas Env&eacute;s <strong><em>&gt;=</em></strong> 244,5 <strong><em>y</em></strong> Tipo I G Haz <strong><em>&lt;</em></strong> 11,5 y Total Tricomas Env&eacute;s <strong><em>&lt;</em></strong> 347,5 <strong><em>y</em></strong> Tipo II Env&eacute;s <strong><em>&lt;</em></strong> 34 <strong>&rarr;</strong>Ds-ACd = 887</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Si </em></strong>Total Tricomas Env&eacute;s <strong><em>&gt;=</em></strong> 244,5 <strong><em>y</em></strong> Tipo I G Haz <strong><em>&lt;</em></strong> 11,5 y Total Tricomas Env&eacute;s <strong><em>&lt;</em></strong> 347,5 <strong><em>y</em></strong> Tipo II Env&eacute;s <strong><em>&gt;=</em></strong> 34 <strong>&rarr;</strong>Ds-ACd = 1188,14</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Si </em></strong>Total Tricomas Env&eacute;s <strong><em>&gt;=</em></strong> 244,5 <strong><em>y</em></strong> Tipo I G Haz <strong><em>&gt;=</em></strong> 11,5 y Tipo I G Haz <strong><em>&lt;</em></strong> 27 <strong>&rarr;</strong>Ds-ACd = 3349,78</font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong><em>Si </em></strong>Total Tricomas Env&eacute;s <strong><em>&gt;=</em></strong> 244,5 <strong><em>y</em></strong> Tipo I G Haz <strong><em>&gt;=</em></strong> 11,5 y Tipo I G Haz <strong>&gt;=</strong> 27 <strong>&rarr;</strong>Ds-ACd = 1561,75</font></p>   </li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La capacidad de RT de  generar una peque&ntilde;a colecci&oacute;n de reglas con una alta confianza representa una  gran ventaja para su mecanismo de interpretaci&oacute;n. RT brinda el conjunto de  reglas ordenadas en cuanto al nivel de confianza y cobertura. Esto facilita el  trabajo de los investigadores, responsables de &ldquo;descubrir&rdquo; indicios de c&oacute;mo se  realiza la producci&oacute;n de los metabolitos, dando explicaci&oacute;n biol&oacute;gica de alguno  de dichos supuestos (reglas). </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A partir del empleo de un conjunto de t&eacute;cnicas  heur&iacute;sticas, fueron determinados los rasgos fenot&iacute;picos que guardan relaci&oacute;n  directa con la producci&oacute;n de cada metabolito estudiado. Logrando un alto nivel  de correlaci&oacute;n y precisi&oacute;n, en comparaci&oacute;n con los m&eacute;todos estad&iacute;sticos  tradicionales. La extracci&oacute;n de estos rasgos facilita la caracterizaci&oacute;n de las  plantas Nicotiana tabacum, en cuanto a la capacidad de producir estos  compuestos naturales.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se implement&oacute; un m&eacute;todo, basado en los &aacute;rboles de  decisi&oacute;n REPTree, el cual es capaz de aprender la correlaci&oacute;n entre rasgos  fenot&iacute;picos y metabolitos secundarios de Nicotiana tabacum con un coeficiente  de correlaci&oacute;n desde el 86% para Alpha_CBT_diol hasta el 91% para Alpha_CBT_ol. El cual tiene, como valor  agregado, la capacidad de generar modelos entendibles para los investigadores.</font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS  BIBLIOGR&Aacute;FICAS</B></font>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">AKAIKE, H., 1974. A new look at the  statistical model identification. <em>IEEE Transactions on Automatic Control</em>, pp. 716-723.     </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">AZOFRA, D., MART&Iacute;NEZ, E., JIM&Eacute;NEZ, E., BLANCO, J., AZOFRA, F.  y SAENZ-D&Iacute;EZ, J.C., 2015. Comparison of the influence of photovoltaic and wind  power on the Spanish electricity prices by means of artificial intelligence  techinques. <em>Renewable and Sustainable Energy Reviews</em> [en l&iacute;nea], vol.  42, pp. 532-542. ISSN 13640321. DOI 10.1016/j.rser.2014.10.048. Disponible en:  http://dx.doi.org/10.1016/j.rser.2014.10.048. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BARTWAL, A., MALL, R., LOHANI, P.,  GURU, S.K. y ARORA, S., 2013. Role of Secondary Metabolites and Brassinosteroids  in Plant Defense Against Environmental Stresses. <em>Journal of Plant Growth  Regulation</em>, vol. 32, no. 1, pp. 216-232. ISSN 07217595. DOI  10.1007/s00344-012-9272-x. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DE&rsquo;ATH, G., 2007. Boosted regression  trees for ecological modeling and prediction. <em>Ecology</em> [en l&iacute;nea], vol. 88,  no. 1, pp. 243-251. ISSN 00129658. DOI  10.1890/0012-9658(2007)88[243:BTFEMA]2.0.CO;2. Disponible en:  http://www.ncbi.nlm.nih.gov/pubmed/17489472. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">JUNG,  Y.G., KANG, M.S. y CHOI, Y.J., 2016. <em>Using J48 and REPTree to predict risk  factors in medicine</em>. 2016. S.l.: s.n.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KORTBEEK, R.W.J., XU, J., RAMIREZ,  A., SPYROPOULOU, E., DIERGAARDE, P., OTTEN-BRUGGEMAN, I., DE BOTH, M., NAGEL,  R., SCHMIDT, A., SCHUURINK, R.C. y BLEEKER, P.M., 2016. Engineering of Tomato  Glandular Trichomes for the Production of Specialized Metabolites. <em>Methods  in Enzymology</em>, ISSN 15577988. DOI 10.1016/bs.mie.2016.02.014.     </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MAAG, D., ERB, M., K&Ouml;LLNER, T.G. y  GERSHENZON, J., 2015. Defensive weapons and defense signals in plants: Some  metabolites serve both roles. <em>BioEssays</em>, vol. 37, no. 2, pp. 167-174.  ISSN 15211878. DOI 10.1002/bies.201400124. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MOORE, B., ANDREW, R., K&Uuml;LHEIM, C. y  FOLEY, W., 2014. Explaining intraspecific diversity in plant secondary  metabolites in an ecological context. <em>New Phytologist</em> [en  l&iacute;nea], vol. 201, pp. 733-750. Disponible en:  http://onlinelibrary.wiley.com/doi/10.1111/nph.12526/full. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">PARK, M. y HONG, E., 2014. Software  Fault Prediction Model using Clustering Algorithms Determining the Number of  Clusters Automatically. <em>International Journal of Software Engineering &amp;  Its &hellip;</em> [en l&iacute;nea], vol. 8, no. 7, pp. 199-204. Disponible en:  http://www.sersc.org/journals/IJSEIA/vol8_no7_2014/16.pdf. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">QUINLAN, R.J., 1992. Learning with  Continuous Classes. <em>5th Australian Joint Conference on Artificial Intelligence</em>.  Singapore: s.n., pp. 343-348.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WANG, C., HE, Q., CHEN, D. y  HU, Q., 2014. A novel method for attribute reduction of covering decision  systems. <em>Information Sciences</em> [en l&iacute;nea], vol. 254, pp. 181-196. ISSN 00200255. DOI  10.1016/j.ins.2013.08.057. Disponible en:  http://dx.doi.org/10.1016/j.ins.2013.08.057.</font></p>     <p name="_ENREF_1">&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 20/05/2017    <br> Aceptado: 25/06/2017</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[AKAIKE]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[A new look at the statistical model identification.]]></source>
<year>1974</year>
<page-range>716-723</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[AZOFRA]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[MARTÍNEZ]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[JIMÉNEZ]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[BLANCO]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[AZOFRA]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[SAENZ-DÍEZ]]></surname>
<given-names><![CDATA[J.C]]></given-names>
</name>
</person-group>
<source><![CDATA[Comparison of the influence of photovoltaic and wind power on the Spanish electricity prices by means of artificial intelligence techinques.]]></source>
<year>2015</year>
<volume>vol. 42</volume>
<page-range>532-542</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BARTWAL]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[MALL]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[LOHANI]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[GURU]]></surname>
<given-names><![CDATA[S.K]]></given-names>
</name>
<name>
<surname><![CDATA[ARORA]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Role of Secondary Metabolites and Brassinosteroids in Plant Defense Against Environmental Stresses]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 32</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>216-232</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DE&#8217;ATH]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Boosted regression trees for ecological modeling and prediction]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 88</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>243-251.</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[JUNG]]></surname>
<given-names><![CDATA[Y.G]]></given-names>
</name>
<name>
<surname><![CDATA[KANG]]></surname>
<given-names><![CDATA[M.S]]></given-names>
</name>
<name>
<surname><![CDATA[CHOI]]></surname>
<given-names><![CDATA[Y.J]]></given-names>
</name>
</person-group>
<source><![CDATA[Using J48 and REPTree to predict risk factors in medicine.]]></source>
<year>2016</year>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KORTBEEK]]></surname>
<given-names><![CDATA[R.W.J]]></given-names>
</name>
<name>
<surname><![CDATA[XU]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[RAMIREZ]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[SPYROPOULOU]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[DIERGAARDE]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[OTTEN-BRUGGEMAN]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[DE BOTH]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[NAGEL]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[SCHMIDT]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[SCHUURINK]]></surname>
<given-names><![CDATA[R.C]]></given-names>
</name>
<name>
<surname><![CDATA[BLEEKER]]></surname>
<given-names><![CDATA[P.M]]></given-names>
</name>
</person-group>
<source><![CDATA[Engineering of Tomato Glandular Trichomes for the Production of Specialized Metabolites.]]></source>
<year>2016</year>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MAAG]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[ERB]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[KÖLLNER]]></surname>
<given-names><![CDATA[T.G]]></given-names>
</name>
<name>
<surname><![CDATA[GERSHENZON]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Defensive weapons and defense signals in plants: Some metabolites serve both roles]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 37</volume>
<numero>no. 2</numero>
<issue>no. 2</issue>
<page-range>167-174</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MOORE]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[ANDREW]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[KÜLHEIM]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[FOLEY]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<source><![CDATA[Explaining intraspecific diversity in plant secondary metabolites in an ecological context]]></source>
<year>2014</year>
<volume>vol. 201</volume>
<page-range>733-750</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[PARK]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[HONG]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Software Fault Prediction Model using Clustering Algorithms Determining the Number of Clusters Automatically]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 8</volume>
<numero>no. 7</numero>
<issue>no. 7</issue>
<page-range>199-204</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[QUINLAN]]></surname>
<given-names><![CDATA[R.J]]></given-names>
</name>
</person-group>
<source><![CDATA[Learning with Continuous Classes]]></source>
<year>1992</year>
<page-range>343-348</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WANG]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[HE]]></surname>
<given-names><![CDATA[Q]]></given-names>
</name>
<name>
<surname><![CDATA[CHEN]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[HU]]></surname>
<given-names><![CDATA[Q]]></given-names>
</name>
</person-group>
<source><![CDATA[A novel method for attribute reduction of covering decision systems.]]></source>
<year>2014</year>
<volume>vol. 254</volume>
<page-range>181-196</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
