<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000300009</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Predictor de interacciones entre estructuras secundarias de proteínas]]></article-title>
<article-title xml:lang="en"><![CDATA[Predictor of interactions between secondary protein structures]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Quintana-Zaez]]></surname>
<given-names><![CDATA[Julio César]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Quintana-Bernabé]]></surname>
<given-names><![CDATA[Nicolás]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Giráldez Rojo]]></surname>
<given-names><![CDATA[Raúl]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Molina-Ruiz]]></surname>
<given-names><![CDATA[Reinaldo]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Santiesteban-Toca]]></surname>
<given-names><![CDATA[Cosme E.]]></given-names>
</name>
<xref ref-type="aff" rid="A04"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Máximo Gómez Báez de Ciego de Ávila Facultad de Informática ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Central Marta Abreu de las Villas Centro de Investigaciones de la Informática ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad Central Marta Abreu de las Villas Centro de Bioactivos Químicos ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A04">
<institution><![CDATA[,Centro de Bioplantas Departamento de Informática ]]></institution>
<addr-line><![CDATA[ Ciego de Ávila]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>3</numero>
<fpage>105</fpage>
<lpage>113</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000300009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000300009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000300009&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="en"><p><![CDATA[RESUMEN Los métodos de predicción de mapas de contacto son un paso intermedio para la predicción de estructuras de proteínas. A pesar de los avances logrados la precisión de las predicciones continúa por debajo del umbral deseado. Una vía mediante la cual el desempeño de estos métodos puede ser elevado es realizando la predicción de las interacciones entre estructuras secundarias. En este artículo se realiza un estudio de la influencia de las interacciones en el plegamiento de las proteínas. Donde, se propone un novedoso meta multiclasificador basado en árboles de decisión para predecir dichas interacciones. El método consiste en un esquema que combina el resultado de diferentes multiclasificadores especializados en las interacciones en el mapa de contacto final. El conjunto de proteínas empleado para validar el modelo contó con 2020 elementos y fue dividido en cuatro particiones, con respecto a su tamaño. La capacidad de generalización promedio alcanzada para los cuatro grupos de proteínas es de 51% de precisión, con una sensibilidad de 74%. El mejor desempeño del algoritmo se logró en proteínas de tamaño medio donde se alcanzó un 55% de precisión.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT The methods for the prediction of contact maps are an intermediate step for the prediction of protein structures. Despite the progress made, the accuracy of the predictions continues below the desired threshold. One way in which the performance of these methods can be heightened is by predicting the interactions between secondary structures. In this paper, we study the influence of interactions in the folding of proteins where we propose a novel multi-class goal based on decision trees to predict such interactions. The method consists of a scheme that combines the result of different specialized multiclassifiers into the interactions in the final contact map. The set of proteins used to validate the model counted on 2020 elements and were divided into four partitions, with respect to their size. The average generalization capacity achieved for all four protein groups is 51% accuracy, with a sensitivity of 74%. The best performance of the algorithm was attained in medium-sized proteins where 55% accuracy was achieved.]]></p></abstract>
<kwd-group>
<kwd lng="en"><![CDATA[Mapa de contacto]]></kwd>
<kwd lng="en"><![CDATA[multiclasificadores]]></kwd>
<kwd lng="en"><![CDATA[árboles de decisión]]></kwd>
<kwd lng="en"><![CDATA[interacciones]]></kwd>
<kwd lng="en"><![CDATA[estructuras secundarias]]></kwd>
<kwd lng="en"><![CDATA[Contact map,]]></kwd>
<kwd lng="en"><![CDATA[multiclassifiers]]></kwd>
<kwd lng="en"><![CDATA[decision trees]]></kwd>
<kwd lng="en"><![CDATA[interactions]]></kwd>
<kwd lng="en"><![CDATA[secondary structures]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Predictor de interacciones entre estructuras secundarias  de prote&iacute;nas</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><em><font face="Verdana, Arial, Helvetica, sans-serif">Predictor of interactions between secondary protein  structures</font></em></strong> </font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong>J<font face="Verdana, Arial, Helvetica, sans-serif">ulio  C&eacute;sar Quintana-Zaez<strong><sup>1,2*</sup></strong>, Nicol&aacute;s  Quintana-Bernab&eacute;<strong><sup>1</sup></strong>, Ra&uacute;l Gir&aacute;ldez Rojo</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup></strong></font><strong><font face="Verdana, Arial, Helvetica, sans-serif">, </font>R<font face="Verdana, Arial, Helvetica, sans-serif">einaldo  Molina-Ruiz</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>3</sup></strong></font><strong><font face="Verdana, Arial, Helvetica, sans-serif">, Cosme  E. Santiesteban-Toca</font> </strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>4</sup></strong></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Facultad de Inform&aacute;tica, Universidad &ldquo;M&aacute;ximo  G&oacute;mez B&aacute;ez&rdquo; de Ciego de &Aacute;vila, Cuba. {<a href="mailto:jcquintana,%20nquintana%7d@unica.cu">jcquintana,  nquintana}@unica.cu</a>     <br>     <sup>2</sup>Centro de Investigaciones de la Inform&aacute;tica,  Universidad Central &ldquo;Marta Abreu&rdquo; de las Villas, Cuba.    ]]></body>
<body><![CDATA[<br>     <sup>3</sup>Centro de Bioactivos Qu&iacute;micos, Universidad  Central &ldquo;Marta Abreu de las Villas&rdquo;, Cuba. <a href="mailto:reymolina@uclv.edu.cu">reymolina@uclv.edu.cu</a></font><font size="2"></font>     <br>     <font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>4</sup>Departamento de Inform&aacute;tica, Centro de  Bioplantas, Ciego de &Aacute;vila, Cuba. <a href="mailto:cosme@bioplantas.cu">cosme@bioplantas.cu</a></font><font size="2"></font>     <br> </p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:jcquintana@unica.cu">jcquintana@unica.cu</a><a href="mailto:liuben@bioplantas.cu"></a><a href="mailto:jova@uci.cu"></a></font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:losorio@ismm.edu.cu"></a> </font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  m&eacute;todos de predicci&oacute;n de mapas de contacto son un paso intermedio para la  predicci&oacute;n de estructuras de prote&iacute;nas. A pesar de los avances logrados la  precisi&oacute;n de las predicciones contin&uacute;a por debajo del umbral deseado. Una v&iacute;a  mediante la cual el desempe&ntilde;o de estos m&eacute;todos puede ser elevado es realizando  la predicci&oacute;n de las interacciones entre estructuras secundarias. En este  art&iacute;culo se realiza un estudio de la influencia de las interacciones en el  plegamiento de las prote&iacute;nas. Donde, se propone un novedoso meta  multiclasificador basado en &aacute;rboles de decisi&oacute;n para predecir dichas  interacciones. El m&eacute;todo consiste en un esquema que combina el resultado de  diferentes multiclasificadores especializados en las interacciones en el mapa  de contacto final. El conjunto de prote&iacute;nas empleado para validar el modelo  cont&oacute; con 2020 elementos y fue dividido en cuatro particiones, con respecto a  su tama&ntilde;o. La capacidad de generalizaci&oacute;n promedio alcanzada para los cuatro  grupos de prote&iacute;nas es de 51% de precisi&oacute;n, con una sensibilidad de 74%. El  mejor desempe&ntilde;o del algoritmo se logr&oacute; en prote&iacute;nas de tama&ntilde;o medio donde se  alcanz&oacute; un 55% de precisi&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Mapa de contacto, multiclasificadores,  &aacute;rboles de decisi&oacute;n, interacciones, estructuras secundarias </font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">The methods for the prediction of contact maps are an intermediate step  for the prediction of protein structures. Despite the progress made, the  accuracy of the predictions continues below the desired threshold. One way in  which the performance of these methods can be heightened is by predicting the  interactions between secondary structures. In this paper, we study the  influence of interactions in the folding of proteins where we propose a novel  multi-class goal based on decision trees to predict such interactions. The  method consists of a scheme that combines the result of different specialized  multiclassifiers into the interactions in the final contact map. The set of  proteins used to validate the model counted on 2020 elements and were divided  into four partitions, with respect to their size. The average generalization  capacity achieved for all four protein groups is 51% accuracy, with a  sensitivity of 74%. The best performance of the algorithm was attained in  medium-sized proteins where 55% accuracy was achieved.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>Contact map, multiclassifiers, decision trees, interactions, secondary  structures</font></p> <hr>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Conocer la estructura de las prote&iacute;nas es  relevante para la Bioinform&aacute;tica debido a que puede servir de base para el dise&ntilde;o  de nuevos f&aacute;rmacos, la obtenci&oacute;n de productos naturales, entre otros. Adem&aacute;s,  algunas de las enfermedades m&aacute;s agresivas que afectan la salud humana como el  Alzh&eacute;imer est&aacute;n estrechamente relacionadas a problemas en el plegamiento de las  prote&iacute;nas (Cohen, 2004). Por otro lado, se conoce que la estructura de  la prote&iacute;na determina su funci&oacute;n. Por tal raz&oacute;n, predecir la estructura de las  prote&iacute;nas se ha convertido en uno de los problemas m&aacute;s interesantes dentro de  la Bioinform&aacute;tica y la Biolog&iacute;a Computacional (Mitra, &amp; Hayashi 2006). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una de las v&iacute;as estudiadas para dilucidar la  estructura de las prote&iacute;nas se basa la predicci&oacute;n de los contactos entre  residuos o mapas de contacto (M&aacute;rquez-Chamorro et&nbsp;al., 2015). Los mapas de contacto son una representaci&oacute;n  matricial de la estructura terciaria de las prote&iacute;nas (Xie et&nbsp;al., 2015). Son considerados &uacute;nicos para cada prote&iacute;na,  por lo que pueden ser empleados para identificar, agrupar o comparar prote&iacute;nas (Andonov, Malod-Dognin, &amp; Yanev, 2011). En las &uacute;ltimas d&eacute;cadas, se han desarrollado  diversos m&eacute;todos para la predicci&oacute;n de contactos entre residuos, entre los  cuales se encuentran m&eacute;todos basados en redes neuronales (Ding et&nbsp;al., 2013; Tegge et&nbsp;al., 2009), m&aacute;quinas de soporte de vectores (Cheng y Baldi, 2007; Howe y Mohamad, 2011), modelos ocultos de <em>Markov</em> (Ashkenazy, Unger, y Kliger, 2011), &Aacute;rboles de decisi&oacute;n (Santiesteban-Toca et&nbsp;al., 2012), aprendizaje profundo (o <em>Deep learning</em>) (P. Di Lena, Nagata, y Baldi, 2012) y algoritmos gen&eacute;ticos. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La informaci&oacute;n com&uacute;n empleada en el proceso de  aprendizaje de los m&eacute;todos para la predicci&oacute;n de mapas de contacto proviene de  diferentes fuentes (Xie et&nbsp;al., 2015). De manera general, esta se relaciona con la  secuencia de amino&aacute;cidos, la estructura secundaria, m&uacute;ltiples alineamientos,  mutaciones correlacionadas, informaci&oacute;n evolutiva, entre otras. Donde, son  empleados los patrones f&iacute;sicos y qu&iacute;micos de los residuos dentro de las  internaciones entre estructuras (Tegge et&nbsp;al., 2009), o se especializan en predecir contactos  espec&iacute;ficos (Randall et&nbsp;al., 2008; Karaka&#351;, Woetzel, &amp; Meiler, 2010; Di Lena, Nagata, &amp; Baldi, 2012).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Debido a la diversidad de m&eacute;todos desarrollados  y esquemas de experimentaci&oacute;n empleados para probar dichos m&eacute;todos, es dif&iacute;cil  establecer una l&iacute;nea que permita una comparaci&oacute;n directa. Sin embargo, a pesar  de los avances alcanzados por los m&eacute;todos para predecir mapas de contacto, la  precisi&oacute;n lograda por los algoritmos es relativamente baja con un promedio  cerca del 50% para toda la prote&iacute;na (M&aacute;rquez-Chamorro et&nbsp;al., 2015). Y seg&uacute;n la competici&oacute;n bi-anual, Evaluaci&oacute;n  Cr&iacute;tica para la Predicci&oacute;n de Contactos (<em>Critical  Assesement for Contact Prediction or CASP</em>), la precisi&oacute;n para los contactos  a largo rango, los cuales constituyen una tarea sumamente compleja por sus  caracter&iacute;sticas (m&aacute;s de 24 residuos de separaci&oacute;n en la secuencia), es  alrededor de 20%-25% (Monastyrskyy et&nbsp;al., 2014).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recientemente,  se han desarrollado t&eacute;cnicas que emplean una representaci&oacute;n espacial de la  vecindad entre estructuras secundarias, residuos e incluso fragmentos de la  prote&iacute;na. Las cuales predicen los mapas de contacto entre estructuras  secundarias (<em>coarse contact maps</em>), en  lugar de los contactos entre residuos, (Wang, Zhu, &amp; Cai, 2009; Di Lena et&nbsp;al. 2008). Es por  ello que, en el presente art&iacute;culo se propone un predictor, basado en la  combinaci&oacute;n de m&uacute;ltiples&nbsp;&nbsp;  clasificadores, sustentado en la hip&oacute;tesis de que las estructuras  secundarias y sus vecindades son las responsables del 90% de los contactos  entre residuos. Por tanto, si se predicen dichas interacciones, se puede elevar  el nivel de precisi&oacute;n de la predicci&oacute;n de los mapas de contactos de prote&iacute;nas.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la primera secci&oacute;n del  art&iacute;culo se hace un estudio de la importancia de las interacciones entre  estructuras secundarias dentro del plegamiento de las prote&iacute;nas y se plantea la  hip&oacute;tesis que sustenta el modelo propuesto. Seguido, se describe el modelo  propuesto y finalmente se analizan los resultados. D&oacute;nde: (1) se selecciona el  mejor clasificador para predecir las interacciones entre estructuras  secundarias, (2) se eval&uacute;a el desempe&ntilde;o del m&eacute;todo propuesto para un dominio de  aplicaci&oacute;n y (3) se propone un mecanismo de interpretaci&oacute;n. Por &uacute;ltimo, se  presentan las conclusiones y trabajos futuros. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo propuesto en esta investigaci&oacute;n se  basa en la predicci&oacute;n de las interacciones entre estructuras secundarias. Donde  para cada interacci&oacute;n se emplea un esquema especializado en los patrones  f&iacute;sicos, qu&iacute;micos y espaciales de estas interacciones. Las interacciones entre  regiones no estabilizadas (<em>coils-coils</em>),  son excluidas. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Base  biol&oacute;gica de la propuesta</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las interacciones no-covalentes a lo largo de  la secuencia juegan un papel importante en el plegamiento y la estabilidad de  la prote&iacute;na, (Gromiha, 2009). Donde, las interacciones entre estructuras  secundarias contienen suficiente informaci&oacute;n acerca del plegamiento final de la  prote&iacute;na (Zaki, Shan Jin, &amp; Bystroff, 2003). &nbsp;Por  tal raz&oacute;n, se realiz&oacute; un an&aacute;lisis del papel que desempe&ntilde;an dichas  interacciones, con el empleo de 2019 prote&iacute;nas no-redundantes extra&iacute;das del  banco de datos de prote&iacute;nas (<em>Protein Data  Bank, o PDB</em>) (Rose et&nbsp;al., 2013). </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La <a href="/img/revistas/rcci/v11n3/f0109317.jpg" target="_blank">Figura  1</a>,  muestra la representaci&oacute;n tridimensional de una prote&iacute;na (izquierda) y su mapa  de contacto (derecha). Donde, las flechas de color amarillo simbolizan las  l&aacute;minas, las rosa a las h&eacute;lices y los alambres de color blanco a las  estructuras <em>coils</em>. Las fechas negras  representan las interacciones entre las estructuras secundarias. A la derecha,  en el mapa de contacto, se observan c&oacute;mo est&aacute;n distribuidos los contactos entre  residuos dentro de las interacciones. Donde, las bandas de color amarillo, rosa  y blanco representan las estructuras secundarias. Los grupos de puntos azules  son los contactos entre residuos dentro de las interacciones. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como puede observarse en la <a href="/img/revistas/rcci/v11n3/f0109317.jpg" target="_blank">Figura  1</a>, un gran porcentaje de las los contactos est&aacute;  relacionado con las interacciones entre estructuras secundarias. En esta  investigaci&oacute;n, cada estructura es tratada como una entidad &uacute;nica y como  separaci&oacute;n se toma en cuenta el n&uacute;mero de estructuras intermedias, <a href="/img/revistas/rcci/v11n3/f0209317.jpg" target="_blank">Figura 2</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La <a href="/img/revistas/rcci/v11n3/f0209317.jpg" target="_blank">Figura 2</a>, muestra la distribuci&oacute;n de las interacciones  entre estructuras secundarias (&alpha;&ndash;&alpha;, &alpha;&ndash;&beta;, &beta;&ndash;&alpha;, and &beta;&ndash;&beta;), en funci&oacute;n de la  separaci&oacute;n en la secuencia. Como se puede observar cerca de 50% de las  interacciones tiene lugar a menos de cinco estructuras de separaci&oacute;n. El 90% de  las interacciones ocurre entre las estructuras &alpha;&ndash;&alpha;, &alpha;&ndash;&beta;, &beta;&ndash;&alpha;, &beta;&ndash;&beta;, &alpha;&ndash;coil,  &beta;&ndash;coil, a un m&aacute;ximo de 15 estructuras de separaci&oacute;n. Adem&aacute;s, ocurren con m&aacute;s  frecuencia las interacciones entre estructuras &alpha;&ndash;&alpha; and &beta;&ndash;&beta;, llegando a superar  en aproximadamente un 30% al resto de las interacciones. En cambio, solo un 10%  de los contactos ocurre en las interacciones coil-coil.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Modelo  propuesto</font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Del  an&aacute;lisis anterior se desprende que, si se predicen las interacciones entre  estructuras secundarias, se puede inferir cerca del 90% de los contactos entre  residuos. Sin embargo, el bajo nivel de precisi&oacute;n alcanzado por los algoritmos  propuestos hasta la fecha podr&iacute;a estar relacionado con: (a) el error  de respuesta de los clasificadores frente a datos que a&uacute;n no le han sido  presentados; (b) elementos en los clasificadores que los hacen caer en  soluciones locales; (c) la incapacidad de dichos clasificadores en representar  adecuadamente el problema. Todo lo cual justifica la combinaci&oacute;n de varios  clasificadores (Kuncheva, 2004; Francia, &amp; Garc&iacute;a, 2006).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el presente art&iacute;culo se propone un esquema  de combinaci&oacute;n de clasificadores, basado en las interacciones entre las  estructuras secundarias de las prote&iacute;nas. El cual consiste en un grupo de  m&uacute;ltiples clasificadores especializados que son seleccionados en dependencia  del dato de entrada, por lo que pudiera ser considerado como un meta multiclasificador,  <a href="/img/revistas/rcci/v11n3/f0309317.jpg" target="_blank">Figura 3</a>. Con este modelo se pretende obtener mayor  provecho del manejo los datos de aprendizaje y de la combinaci&oacute;n de los  resultados de sus predicciones. </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Nivel de datos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La <a href="/img/revistas/rcci/v11n3/f0309317.jpg" target="_blank">Figura 3</a>, muestra la arquitectura del predictor  propuesto, el cual consiste en cuatro niveles. Donde, a nivel  de datos, se cuenta con un conjunto de prote&iacute;nas extra&iacute;das del PDB. A cada  prote&iacute;na se le extraen las interacciones entre estructuras secundarias.  Posteriormente, mediante el empleo de un criterio de selecci&oacute;n, cada tipo de  interacci&oacute;n es almacenada en conjuntos de datos espec&iacute;ficos y disjuntos {&alpha;&ndash;&alpha;,  &alpha;&ndash;&beta;, &alpha;&ndash;coil, &beta;&ndash;&alpha;, &beta;&ndash;&beta;, &beta;&ndash;coil, coil&ndash;&alpha;, coil&ndash;&beta;}. El objetivo de este nivel es  dividir el problema en sub-problemas que permitan garantizar que cada modelo se  especialice en un sub-espacio del problema general. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Nivel de vector</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el nivel de vector son creados los vectores de rasgos que describen  las interacciones. En nuestra investigaci&oacute;n las estructuras secundarias se  representan como una entidad &uacute;nica con propiedades f&iacute;sicas y qu&iacute;micas  (atributos), derivados de la frecuencia de los residuos que las integran. El  modelo para describir dichas interacciones emplea un vector de 206 atributos de  longitud, que incluye informaci&oacute;n sobre las estructuras objetivo y su vecindad (&plusmn;1  estructura adyacente). La descripci&oacute;n de los atributos empleados en el vector  de rasgos se muestra en la <a href="/img/revistas/rcci/v11n3/t0109317.jpg" target="_blank">tabla 1</a>. </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Nivel de clasificadores base</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el nivel de clasificadores base son empleados multiclasificadores  id&eacute;nticos, pero especializados en cada tipo de interacci&oacute;n (<a href="/img/revistas/rcci/v11n3/f0409317.jpg" target="_blank">Figura 4</a>). La raz&oacute;n fundamental por la que se decidi&oacute;  el empleo de nuevos multiclasificadores fue crear un esquema de entrenamiento  que permitiese incrementar el espacio de b&uacute;squeda a la vez que se redujera el  nivel de desbalance y solapamiento de los datos. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la <a href="/img/revistas/rcci/v11n3/f0409317.jpg" target="_blank">Figura 4</a>, se muestra el proceso de creaci&oacute;n de los  multiclasificadores base. Donde, debido al alto nivel de desbalance y  solapamiento que existe, el conjunto de vectores inicial es dividido en <em>K</em> particiones impares mediante el empleo  de un muestreo con remplazo. Cada subconjunto mantiene todos los elementos de  la clase contactos y agrega elementos de la clase no-contacto, de forma que se  logre una raz&oacute;n de desbalance de 1:2. Este proceso garantiza la diversidad de  los multiclasificadores base propuestos. La combinaci&oacute;n sus decisiones se  realizan mediante el voto mayoritario simple.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Nivel de combinaci&oacute;n</strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Finalmente, corresponde el nivel de combinaci&oacute;n de los resultados del  meta multiclasificador. A pesar de existir varios m&eacute;todos de combinaci&oacute;n de la  clasificaci&oacute;n, ya sean a nivel abstracto, de ranking o de medici&oacute;n (Kuncheva,  2004), se  decidi&oacute; por una combinaci&oacute;n a nivel de medici&oacute;n. Esto se debe a que se conoce  previamente cu&aacute;l es la efectividad de cada multiclasificador clasificador para  cada tipo de interacci&oacute;n (1). </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/fo0109317.jpg" alt="fo01" width="264" height="38"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde, <strong><em>D</em></strong> es la decisi&oacute;n final, <strong><em>wi</em></strong> el peso asignado por el selector, <strong><em>ei</em></strong>, la estimaci&oacute;n  realizada por los multiclasificadores e <strong><em>I</em></strong>, el tipo de interacci&oacute;n. Donde, <strong><em>i</em> &isin; <em>I</em> = {</strong>HH, HS, SH, SS, HC, CH, SC, CS<strong>}</strong>. Si se toma en cuenta que el selector devuelve como resultado <strong><em>1</em></strong> si la interacci&oacute;n es de un tipo y <strong><em>0</em></strong> para el resto. Entonces el  resultado de la combinaci&oacute;n ser&iacute;a equivalente a la selecci&oacute;n del clasificador  adecuado. Lo que da lugar a la construcci&oacute;n en el mapa de contacto de la  prote&iacute;na.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este ep&iacute;grafe se seleccionan los  clasificadores base empleados, se analiza el desempe&ntilde;o del algoritmo en cuanto  a su robustez y capacidad de generalizaci&oacute;n y la comparaci&oacute;n con los  clasificadores del estado-del-arte. Para evaluar los resultados del esquema  experimental fueron empleadas la precisi&oacute;n, la sensibilidad y la media arm&oacute;nica  entre ambas (Garc&iacute;a et&nbsp;al., 2010).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Selecci&oacute;n  de clasificadores base</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Debido a que se desea obtener modelos que  permitan explicar qu&eacute; sucede en el proceso de plegamiento de las prote&iacute;nas,  solo se consideraron algoritmos basados en &aacute;rboles de decisi&oacute;n (Wu, &amp; Kumar, 2009). Los algoritmos empleados son las  implementaciones de Weka de J48, <em>LADTree</em>, <em>RandomForest</em>, <em>RandomTree</em>, <em>REPTree</em>, <em>ADTree</em>, <em>BFTree</em>, <em>LMT</em>, <em>FT</em>, <em>NBTree</em> (Kalmegh, 2015). Para validar dichos algoritmos se utiliz&oacute; un  conjunto de 46 prote&iacute;nas mezcladas con representatividad de Alfa, A+B, A/B y  Beta.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A  cada uno de los clasificadores se aplic&oacute; un proceso de selecci&oacute;n de par&aacute;metros  &oacute;ptimos. Donde, los algoritmos se entrenaron y probaron con todo el conjunto de  prote&iacute;nas. Finalmente, para cada algoritmo se seleccion&oacute; la mejor combinaci&oacute;n  de par&aacute;metros, los mejores resultados obtenidos para esta combinaci&oacute;n se  muestran en la <a href="/img/revistas/rcci/v11n3/t0209317.jpg" target="_blank">Tabla  2</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La<a href="/img/revistas/rcci/v11n3/t0209317.jpg" target="_blank"> Tabla  2</a>  , muestra los resultados de la selecci&oacute;n de  clasificadores base, donde se puede apreciar que los valores obtenidos para la  precisi&oacute;n por los m&eacute;todos empleados esta entre 62% y 100% con un promedio de  91%. En cuanto a sensibilidad los valores est&aacute;n entre 54% y 94% con promedio de  76%. Para la medida Fm los valores observados son entre 61% y 97% con promedio  82%.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Un an&aacute;lisis particular de los resultados podemos notar que el m&eacute;todo de  peor desempe&ntilde;o en cuanto a la precisi&oacute;n es <em>DecisionStump</em> con un 62% de precisi&oacute;n. En cambio, para la sensibilidad, los m&eacute;todos con menor  capacidad de recuerdo para el conjunto de prote&iacute;nas empleado son ADT y LADT con  valores de 55% y 54% respectivamente. De manera general, el algoritmo de mejor  desempe&ntilde;o fue <em>RandomForest</em> el cual supera  al resto de los m&eacute;todos empleados en el estudio.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Robustez  y capacidad de generalizaci&oacute;n </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para analizar la robustez y capacidad de  generalizaci&oacute;n del m&eacute;todo propuesto se emple&oacute; un conjunto de 2020 prote&iacute;nas  dividido por diferentes longitudes de secuencia (&lt;100, 100-200, 200-300,  &gt;300). Se realiz&oacute; una validaci&oacute;n cruzada para 10. Los resultados se muestran  en la <a href="/img/revistas/rcci/v11n3/t0309317.jpg" target="_blank">Tabla 3</a>. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La  <a href="/img/revistas/rcci/v11n3/t0309317.jpg" target="_blank">Tabla 3</a>, muestra  el desempe&ntilde;o alcanzado por el meta multiclasificador propuesto empleando un <em>RandomForest</em> como clasificador base.  Donde, el promedio para las m&eacute;tricas empleadas es de 51%, 74% y 59%.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se puede  observar que el mejor desempe&ntilde;o en cuanto a precisi&oacute;n se obtuvo en prote&iacute;nas  con una longitud de secuencia entre 100-200 amino&aacute;cidos. Para el resto de los  grupos los valores para esta medida se comportaron de manera similar y cerca  del 50% ( <span dir="RTL">  1</span>    ). Para la sensibilidad, se logr&oacute; recordad  un mayor n&uacute;mero de interacciones para los conjuntos de prote&iacute;nas con longitud  superior a los 200 amino&aacute;cidos. Donde, se obtuvieron valores cercanos al 80% ( <span dir="RTL">  1</span>    ). Finalmente, para Fm, los valores fueron  similares para los conjuntos de prote&iacute;nas con longitud superior a 100  amino&aacute;cidos 62% ( <span dir="RTL">  1</span>    ). En cambio,  para prote&iacute;nas peque&ntilde;as, la media arm&oacute;nica entre la precisi&oacute;n y la sensibilidad  fue cerca de 51%.&nbsp; </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Dominio  de aplicaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para analizar el desempe&ntilde;o del m&eacute;todo propuesto  en diferentes dominios de aplicaci&oacute;n se emple&oacute; un conjunto de 45 prote&iacute;nas  dividido por clases estructurales (Alfa, Beta, A+B y A/B, Todas). Se realiz&oacute;  una validaci&oacute;n cruzada para 10 particiones con dos repeticiones. Los resultados  se muestran en la <a href="/img/revistas/rcci/v11n3/t0409317.jpg" target="_blank">Tabla 4</a>. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La <a href="/img/revistas/rcci/v11n3/t0409317.jpg" target="_blank">Tabla 4</a>, muestra  el desempe&ntilde;o alcanzado por el meta multiclasificador propuesto. Donde, para el  conjunto de prote&iacute;nas Alfa se alcanz&oacute; la mayor precisi&oacute;n con un 35%. En cambio,  para el conjunto Beta, la precisi&oacute;n fue de 25%. En general el promedio para  esta medida fue de 29%. Por otra parte la sensibilidad fue superior en el  conjunto de prote&iacute;nas Beta con un valor de 85%, para el resto de los conjuntos  los valores fueron alrededor del 72% (&plusmn;  <span dir="RTL">  5</span>   ). En cuanto a la m&eacute;trica Fm, al promedio  fue de 40%. Donde para el conjunto de prote&iacute;nas con mayor&iacute;a Alfa la media  arm&oacute;nica entre la precisi&oacute;n y la sensibilidad lograda fue de 47%.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Por otro parte,  un an&aacute;lisis sobre el conjunto de todos los grupos, la precisi&oacute;n alcanzada  supera la de los grupos por separado, con un 41%. Con una sensibilidad similar  a la obtenida en prote&iacute;nas Beta, donde la m&eacute;trica Fm logra superar el 50%.</font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los m&eacute;todos de predicci&oacute;n de mapas de contacto  son un paso intermedio para la predicci&oacute;n de estructuras de prote&iacute;nas. Una  forma mediante la cual el desempe&ntilde;o de estos m&eacute;todos puede ser elevado es  realizando la predicci&oacute;n de las interacciones entre estructuras secundarias.  Este proceso puede reducir el espacio de b&uacute;squeda de contactos entre residuos,  adem&aacute;s es suficientemente informativo con respecto al plegamiento de las  prote&iacute;nas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este art&iacute;culo se realiz&oacute; un estudio de la  influencia de las interacciones en el plegamiento de las prote&iacute;nas. Donde se  demostr&oacute; que las interacciones &alpha;-&alpha;, &alpha;-&beta;, &beta;-&alpha;, &beta;-&beta;, &beta;-coil, coil-&beta;, &alpha;-coil,  coil-&alpha; tienen una responsabilidad directa sobre el 90% de los contactos entre  amino&aacute;cidos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se propuso un meta multiclasificador basado en  &aacute;rboles de decisi&oacute;n para predecir las interacciones entre estructuras de prote&iacute;nas.  Se realiz&oacute; una comparaci&oacute;n entre diferentes algoritmos para seleccionar los  clasificadores base para el meta multiclasificador, donde el mejor desempe&ntilde;o lo  obtuvo <em>RandomForest</em>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El m&eacute;todo se valid&oacute; en varios conjuntos de  prote&iacute;nas, donde el mejor desempe&ntilde;o en cuanto a precisi&oacute;n se obtuvo en las  prote&iacute;nas Alfa con un 79%. En cambio, la sensibilidad superior se logr&oacute; en  prote&iacute;nas Beta.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Adem&aacute;s, en cuanto a robustez y capacidad de generalizaci&oacute;n el  modelo propuesto se comporta mejor en prote&iacute;nas con longitud superior a los 200  amino&aacute;cidos. De manera general el algoritmo propuesto obtuvo un promedio de 51%  de precisi&oacute;n, con una sensibilidad de 74%. </font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>AGRADECIMIENTOS</B></font>      <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se les agradece a los profesores de la Facultad  de Inform&aacute;tica de la Universidad de Ciego de &Aacute;vila &ldquo;M&aacute;ximo G&oacute;mez B&aacute;ez&rdquo; por el  tiempo dedicado. A los profesores del Centro de Investigaciones de la  Inform&aacute;tica (CII) y del Centro de Bioactivos Qu&iacute;micos (CBQ) de la Universidad  Central &ldquo;Marta Abreu de las Villas&rdquo;, a los trabajadores e investigadores del  Centro de Bioplantas de Ciego de Avila por la ayuda y los conocimientos  brindados. </font>     <p align="left">      ]]></body>
<body><![CDATA[<p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS  BIBLIOGR&Aacute;FICAS</B></font>      <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ABU-DOLEH, A.A., AL-JARRAH, O.M.  y ALKHATEEB, A., 2012. Protein contact map prediction  using multi-stage hybrid intelligence inference systems. <em>Journal of  Biomedical Informatics</em>, vol. 45, no. 1, pp. 173-183. ISSN 15320464. DOI  10.1016/j.jbi.2011.10.008. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ANDONOV, R., MALOD-DOGNIN, N. y YANEV, N., 2011. Maximum Contact Map  Overlap Revisited. <em>Journal of Computational Biology</em>, vol. 18, no. 1, pp.  27-41. ISSN 1066-5277, 1557-8666. DOI 10.1089/cmb.2009.0196. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ASHKENAZY, H., UNGER, R. y KLIGER,  Y., 2011. Hidden conformations in protein structures. <em>Bioinformatics</em>, vol. 27, no. 14, pp.  1941&ndash;1947. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CHAMORRO, A.E.M., DIVINA, F.,  AGUILAR-RUIZ, J.S. y CORT&Eacute;S, G.A., 2011. A  multi-objective genetic algorithm for the Protein Structure Prediction. <em>Intelligent  Systems Design and Applications (ISDA), 2011 11th International Conference on</em>.  S.l.: IEEE, pp. 1086&ndash;1090. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CHEN, P. y LI, J., 2010. Prediction of protein long-range contacts  using an ensemble of genetic algorithm classifiers with sequence profile  centers. <em>BMC structural biology</em>, vol. 10, no. 1, pp. 1. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CHENG, J. y BALDI, P., 2007. Improved residue contact prediction  using support vector machines and a large feature set. <em>BMC Bioinformatics</em>,  vol. 8, no. 1, pp. 113. ISSN 14712105. DOI 10.1186/1471-2105-8-113. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">COHEN, J., 2004. Bioinformatics&mdash;an introduction for computer  scientists. <em>ACM  Computing Surveys (CSUR)</em>, vol. 36, no. 2, pp. 122&ndash;158. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DI LENA, P., MARGARA, L.,  VASSURA, M., FARISELLI, P. y CASADIO, R., 2008. A new  protein representation based on fragment contacts: towards an improvement of  contact maps predictions. <em>Computational Intelligence Methods for  Bioinformatics and Biostatistics</em>. S.l.: Springer, pp. 210&ndash;221. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DI LENA, P., NAGATA, K. y BALDI,  P., 2012. Deep architectures for protein contact map  prediction. <em>Bioinformatics</em>, vol. 28, no. 19, pp. 2449-2457. ISSN  1367-4803, 1460-2059. DOI 10.1093/bioinformatics/bts475. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DING, W., XIE, J., DAI, D., ZHANG, H., XIE, H. y ZHANG, W., 2013.  CNNcon: Improved Protein Contact Maps Prediction Using Cascaded Neural  Networks. En: B.  XUE (ed.), <em>PLoS ONE</em>, vol. 8, no. 4, pp. e61533. ISSN 1932-6203. DOI  10.1371/journal.pone.0061533. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">FRANCIA, S.S. y GARC&Iacute;A, M.N.M.,  2006. <em>Multiclasificadores: M&eacute;todos y Arquitecturas</em>. S.l.: Universidad de  Salamanca. Departamento de Inform&aacute;tica y Autom&aacute;tica.     </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GARC&Iacute;A, S., FERN&Aacute;NDEZ, A.,  LUENGO, J. y HERRERA, F., 2010. Advanced nonparametric  tests for multiple comparisons in the design of experiments in computational  intelligence and data mining: Experimental analysis of power. <em>Information  Sciences</em>, vol. 180, no. 10, pp. 2044-2064. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GROMIHA, M.M., 2009. Multiple Contact Network Is a Key Determinant  to Protein Folding Rates. <em>Journal of Chemical Information and Modeling</em>,  vol. 49, no. 4, pp. 1130-1135. ISSN 1549-9596, 1549-960X. DOI  10.1021/ci800440x. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">HOWE, C.W. y MOHAMAD, M.S., 2011. Protein Residue Contact Prediction  using Support Vector Machine. <em>World Academy of Science, Engineering and  Technology</em>, vol. 60, pp. 1985&ndash;1990. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KALMEGH, S., 2015. Analysis of WEKA data mining algorithm REPTree,  Simple CART and RandomTree for classification of Indian news. <em>International  Journal of Innovative Science, Engineering and Technology</em>, vol. 2, no. 2,  pp. 438-46. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KARAKA&#350;, M., WOETZEL, N. y MEILER,  J., 2010. BCL::Contact&ndash;Low Confidence Fold Recognition  Hits Boost Protein Contact Prediction and <em>De Novo</em> Structure  Determination. <em>Journal of Computational Biology</em>, vol. 17, no. 2, pp.  153-168. ISSN 1066-5277, 1557-8666. DOI 10.1089/cmb.2009.0030. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KUNCHEVA, L.I., 2004. <em>Combining pattern classifiers: methods and  algorithms</em>. Hoboken,  NJ: J. Wiley. ISBN 978-0-471-21078-8. TK7882.P3 K83 2004</font><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">M&Aacute;RQUEZ-CHAMORRO, A.E.,  ASENCIO-CORTES, G., DIVINA, F. y AGUILAR-RUIZ, J.S., 2014. Evolutionary decision rules for predicting protein contact maps. <em>Pattern  Analysis and Applications</em>, vol. 17, no. 4, pp. 725&ndash;737. </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">M&Aacute;RQUEZ-CHAMORRO, A.E.,  ASENCIO-CORT&Eacute;S, G., SANTIESTEBAN-TOCA, C.E. y AGUILAR-RUIZ, J.S., 2015. Soft computing methods for the prediction of protein tertiary  structures: A survey. <em>Applied Soft Computing</em>, vol. 35, pp. 398&ndash;410. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MITRA, S. y HAYASHI, Y., 2006. Bioinformatics with soft computing. <em>IEEE  Transactions on Systems, Man and Cybernetics, Part C (Applications and Reviews)</em>,  vol. 36, no. 5, pp. 616-635. ISSN 1094-6977. DOI 10.1109/TSMCC.2006.879384. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MONASTYRSKYY, B., D&rsquo;ANDREA, D., FIDELIS, K., TRAMONTANO, A. y  KRYSHTAFOVYCH, A., 2014. Evaluation of residue-residue contact prediction in  CASP10: Contact Prediction in CASP10. <em>Proteins: Structure, Function, and  Bioinformatics</em>, vol. 82, pp. 138-153. ISSN 08873585. DOI  10.1002/prot.24340. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">RANDALL, A., CHENG, J., SWEREDOSKI, M. y BALDI, P., 2008. TMBpro:  secondary structure, -contact and tertiary structure prediction of  transmembrane -barrel proteins. <em>Bioinformatics</em>, vol. 24, no. 4, pp.  513-520. ISSN 1367-4803, 1460-2059. DOI 10.1093/bioinformatics/btm548. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ROSE, P.W., BI, C., BLUHM, W.F., CHRISTIE, C.H., DIMITROPOULOS, D.,  DUTTA, S., GREEN, R.K., GOODSELL, D.S., PRLIC, A., QUESADA, M., QUINN, G.B.,  RAMOS, A.G., WESTBROOK,</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">J.D., YOUNG, J., ZARDECKI, C., BERMAN, H.M. y BOURNE,  P.E., 2013. The RCSB Protein Data Bank: new resources for research and  education. <em>Nucleic Acids Research</em>,  vol. 41, no. D1, pp. D475D482. ISSN 0305-1048, 1362-4962. DOI 10.1093/nar/gks1200. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SANTIESTEBAN-TOCA, C.E.,  ASENCIO-CORT&Eacute;S, G., M&Aacute;RQUEZ-CHAMORRO, A.E. y AGUILAR-RUIZ, J.S., 2012. Short-Range interactions and decision tree-based protein contact map  predictor. <em>Evolutionary Computation, Machine Learning and Data Mining in  Bioinformatics</em> [en l&iacute;nea]. S.l.: Springer, pp. 224&ndash;233. [Consulta: 12 octubre 2015]. Disponible  en: http://link.springer.com/chapter/10.1007/978-3-642-29066-4_20. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">TEGGE, A.N., WANG, Z., EICKHOLT, J. y CHENG, J., 2009. NNcon:  improved protein contact map prediction using 2D-recursive neural networks. <em>Nucleic  Acids Research</em>, vol. 37, no. Web Server, pp.W515-W518. ISSN 0305-1048, 1362-4962. DOI 10.1093/nar/gkp305. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WANG, C.-Y., ZHU, H.-D. y CAI,  L., 2009. A new prediction protein structure method  based on genetic algorithm and coarse-grained protein model. <em>Biomedical  Engineering and Informatics, 2009. BMEI&rsquo;09. 2nd International Conference on</em> [en l&iacute;nea]. S.l.:  IEEE, pp. 1&ndash;5. [Consulta: 19 octubre 2015]. Disponible en:  http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5305230. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WU, X. y KUMAR, V., 2009. <em>The top ten algorithms in data mining</em> [en l&iacute;nea]. S.l.:  CRC Press. [Consulta: 19 octubre 2015]. Disponible en: https://books.google.com/books.     </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">XIE, J., DING, W., CHEN, L., GUO, Q. y ZHANG, W., 2015. Advances in  Protein Contact Map Prediction Based on Machine Learning. <em>Medicinal  Chemistry</em>, vol. 11, no. 3, pp. 265&ndash;270.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ZAKI,  M.J., SHAN JIN y BYSTROFF, C., 2003. Mining residue contacts in proteins using  local structure predictions. <em>IEEE Transactions on Systems, Man and  Cybernetics, Part B (Cybernetics)</em>, vol. 33, no. 5, pp. 789-801. ISSN  1083-4419. DOI 10.1109/TSMCB.2003.816916.</font></p>     <p name="_ENREF_1">&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 20/05/2017    <br> Aceptado: 25/06/2017</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ABU-DOLEH]]></surname>
<given-names><![CDATA[A.A]]></given-names>
</name>
<name>
<surname><![CDATA[AL-JARRAH]]></surname>
<given-names><![CDATA[O.M]]></given-names>
</name>
<name>
<surname><![CDATA[ALKHATEEB]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Protein contact map prediction using multi-stage hybrid intelligence inference systems.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 45</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>pp. 173-183</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ANDONOV]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[MALOD-DOGNIN]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[YANEV]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Maximum Contact Map Overlap Revisited]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 18</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>27-41</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ASHKENAZY]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[UNGER]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[KLIGER]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Hidden conformations in protein structures]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 27</volume>
<numero>no. 14</numero>
<issue>no. 14</issue>
<page-range>1941-1947</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHAMORRO]]></surname>
<given-names><![CDATA[A.E.M]]></given-names>
</name>
<name>
<surname><![CDATA[DIVINA]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[AGUILAR-RUIZ]]></surname>
<given-names><![CDATA[J.S]]></given-names>
</name>
<name>
<surname><![CDATA[CORTÉS]]></surname>
<given-names><![CDATA[G.A]]></given-names>
</name>
</person-group>
<source><![CDATA[A multi-objective genetic algorithm for the Protein Structure Prediction.]]></source>
<year>2011</year>
<page-range>1086-1090</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHEN]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[LI]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Prediction of protein long-range contacts using an ensemble of genetic algorithm classifiers with sequence profile centers]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 10</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>pp. 1</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHENG]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[BALDI]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Improved residue contact prediction using support vector machines and a large feature set]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 8</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>pp. 113</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[COHEN]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bioinformatics-an introduction for computer scientists.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 36</volume>
<numero>no. 2</numero>
<issue>no. 2</issue>
<page-range>. 122-158</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DI LENA]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[MARGARA]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[VASSURA]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[FARISELLI]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[CASADIO]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[A new protein representation based on fragment contacts: towards an improvement of contact maps predictions]]></source>
<year>2008</year>
<page-range>210-221</page-range><publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DI LENA]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[NAGATA]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[BALDI]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Deep architectures for protein contact map prediction]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 28</volume>
<numero>no. 19</numero>
<issue>no. 19</issue>
<page-range>2449-2457</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DING]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[XIE]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[DAI]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[ZHANG]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[XIE]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[ZHANG]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[CNNcon: Improved Protein Contact Maps Prediction Using Cascaded Neural Networks]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 8</volume>
<numero>no. 4</numero>
<issue>no. 4</issue>
<page-range>pp. e61533</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FRANCIA]]></surname>
<given-names><![CDATA[S.S]]></given-names>
</name>
<name>
<surname><![CDATA[GARCÍA]]></surname>
<given-names><![CDATA[M.N.M]]></given-names>
</name>
</person-group>
<source><![CDATA[Multiclasificadores: Métodos y Arquitecturas]]></source>
<year>2006</year>
<publisher-name><![CDATA[Universidad de Salamanca]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GARCÍA]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[FERNÁNDEZ]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[LUENGO]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[HERRERA]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Advanced nonparametric tests for multiple comparisons in the design of experiments in computational intelligence and data mining: Experimental analysis of power]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 180</volume>
<numero>no. 10</numero>
<issue>no. 10</issue>
<page-range>2044-2064</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GROMIHA]]></surname>
<given-names><![CDATA[M.M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multiple Contact Network Is a Key Determinant to Protein Folding Rates.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 49</volume>
<numero>no. 4</numero>
<issue>no. 4</issue>
<page-range>pp. 1130-1135</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HOWE]]></surname>
<given-names><![CDATA[C.W]]></given-names>
</name>
<name>
<surname><![CDATA[MOHAMAD]]></surname>
<given-names><![CDATA[M.S]]></given-names>
</name>
</person-group>
<source><![CDATA[Protein Residue Contact Prediction using Support Vector Machine.]]></source>
<year>2011</year>
<volume>vol. 60</volume>
<page-range>1985-1990</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KALMEGH]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Analysis of WEKA data mining algorithm REPTree, Simple CART and RandomTree for classification of Indian news.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 2,</volume>
<numero>no. 2</numero>
<issue>no. 2</issue>
<page-range>pp. 438-46</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KARAKA&#350;]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[WOETZEL]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[MEILER]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[BCL::Contact-Low Confidence Fold Recognition Hits Boost Protein Contact Prediction and De Novo Structure Determination]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 17</volume>
<numero>no. 2</numero>
<issue>no. 2</issue>
<page-range>153-168</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KUNCHEVA]]></surname>
<given-names><![CDATA[L.I]]></given-names>
</name>
</person-group>
<source><![CDATA[Combining pattern classifiers: methods and algorithms]]></source>
<year>2004</year>
<publisher-name><![CDATA[Hoboken, NJ: J. Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MÁRQUEZ-CHAMORRO]]></surname>
<given-names><![CDATA[A.E]]></given-names>
</name>
<name>
<surname><![CDATA[ASENCIO-CORTES]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[DIVINA]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[AGUILAR-RUIZ]]></surname>
<given-names><![CDATA[J.S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evolutionary decision rules for predicting protein contact maps]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 17</volume>
<numero>no. 4</numero>
<issue>no. 4</issue>
<page-range>725-737</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MÁRQUEZ-CHAMORRO]]></surname>
<given-names><![CDATA[A.E]]></given-names>
</name>
<name>
<surname><![CDATA[ASENCIO-CORTÉS]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[SANTIESTEBAN-TOCA]]></surname>
<given-names><![CDATA[C.E]]></given-names>
</name>
<name>
<surname><![CDATA[AGUILAR-RUIZ]]></surname>
<given-names><![CDATA[J.S]]></given-names>
</name>
</person-group>
<source><![CDATA[Soft computing methods for the prediction of protein tertiary structures: A survey]]></source>
<year>2015</year>
<volume>vol. 35</volume>
<page-range>398-410</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MITRA]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[HAYASHI]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bioinformatics with soft computing]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 36</volume>
<numero>no. 5</numero>
<issue>no. 5</issue>
<page-range>616-635</page-range></nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MONASTYRSKYY]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[D&#8217;ANDREA]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[FIDELIS]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[TRAMONTANO]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[KRYSHTAFOVYCH]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Evaluation of residue-residue contact prediction in CASP10: Contact Prediction in CASP10. Proteins: Structure, Function, and Bioinformatics]]></source>
<year>2014</year>
<volume>vol. 82</volume>
<page-range>138-153</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[RANDALL]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[CHENG]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[SWEREDOSKI]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[BALDI]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[TMBpro: secondary structure, -contact and tertiary structure prediction of transmembrane -barrel proteins.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 24</volume>
<numero>no. 4</numero>
<issue>no. 4</issue>
<page-range>513-520</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ROSE]]></surname>
<given-names><![CDATA[P.W]]></given-names>
</name>
<name>
<surname><![CDATA[YOUNG]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[ZARDECKI]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[BERMAN]]></surname>
<given-names><![CDATA[H.M]]></given-names>
</name>
<name>
<surname><![CDATA[BOURNE]]></surname>
<given-names><![CDATA[P.E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The RCSB Protein Data Bank: new resources for research and education]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 41</volume>
<numero>no. D1</numero>
<issue>no. D1</issue>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SANTIESTEBAN-TOCA]]></surname>
<given-names><![CDATA[C.E]]></given-names>
</name>
<name>
<surname><![CDATA[ASENCIO-CORTÉS]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[MÁRQUEZ-CHAMORRO]]></surname>
<given-names><![CDATA[A.E]]></given-names>
</name>
<name>
<surname><![CDATA[AGUILAR-RUIZ]]></surname>
<given-names><![CDATA[J.S]]></given-names>
</name>
</person-group>
<source><![CDATA[Short-Range interactions and decision tree-based protein contact map predictor]]></source>
<year>2012</year>
<page-range>. 224-233</page-range><publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TEGGE]]></surname>
<given-names><![CDATA[A.N]]></given-names>
</name>
<name>
<surname><![CDATA[WANG]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[EICKHOLT]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[CHENG]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[NNcon: improved protein contact map prediction using 2D-recursive neural networks]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 37</volume>
<numero>no. Web Server</numero>
<issue>no. Web Server</issue>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WANG]]></surname>
<given-names><![CDATA[C.-Y]]></given-names>
</name>
<name>
<surname><![CDATA[ZHU]]></surname>
<given-names><![CDATA[H.-D]]></given-names>
</name>
<name>
<surname><![CDATA[CAI]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[A new prediction protein structure method based on genetic algorithm and coarse-grained protein model]]></source>
<year>2009</year>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WU]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[KUMAR]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<source><![CDATA[The top ten algorithms in data mining]]></source>
<year>2009</year>
<publisher-name><![CDATA[CRC Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[XIE]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[DING]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[CHEN]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[GUO]]></surname>
<given-names><![CDATA[Q]]></given-names>
</name>
<name>
<surname><![CDATA[ZHANG]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Advances in Protein Contact Map Prediction Based on Machine Learning]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 11</volume>
<numero>no. 3</numero>
<issue>no. 3</issue>
<page-range>265-270</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ZAKI]]></surname>
<given-names><![CDATA[M.J]]></given-names>
</name>
<name>
<surname><![CDATA[SHAN]]></surname>
<given-names><![CDATA[JIN]]></given-names>
</name>
<name>
<surname><![CDATA[BYSTROFF]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mining residue contacts in proteins using local structure predictions.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 33</volume>
<numero>no. 5</numero>
<issue>no. 5</issue>
<page-range>789-801</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
