<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000300003</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Inferencia de redes de asociación de genes empleando algoritmos genéticos y topología de grafos]]></article-title>
<article-title xml:lang="en"><![CDATA[Inference of gene association networks using genetic algorithms and graph topology]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[López Aparicio]]></surname>
<given-names><![CDATA[Liuben]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Santiesteban-Toca]]></surname>
<given-names><![CDATA[Cosme E]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Giráldez Rojo]]></surname>
<given-names><![CDATA[Raúl]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Máximo Gómez Báez Centro de Bioplantas ]]></institution>
<addr-line><![CDATA[ Ciego de Ávila]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Pablo de Olavide  ]]></institution>
<addr-line><![CDATA[ Sevilla]]></addr-line>
<country>España</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>3</numero>
<fpage>21</fpage>
<lpage>35</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000300003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000300003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000300003&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[RESUMEN Debido a que existe un gran número de enfermedades de naturaleza poligenética, en la actualidad se confiere mayor importancia al resultado de la interacción genética que a la función de cada gen por separado. Por este motivo es muy significativo el estudio de las redes de genes. En los últimos años se ha afrontado el problema de inferir redes de asociación de genes mediante diversas técnicas, sin embargo, a pesar de estos esfuerzos, aun no se logra un grado significativo de precisión al inferir las redes. Es por ello que se propone un algoritmo de inferencia de redes de genes basado en un algoritmo genético que toma en cuenta que muchas de las redes biológicas caracterizadas de forma experimental se ajustan a la topología de grafos libres de escala y de mundo pequeño. Como resultado, este algoritmo logra inferir redes de genes con una alta precisión y manteniendo el sentido biológico.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[ABSTRACT Because of the existence of a large number of diseases of polygenic nature, a greater importance to the result of genetic interaction is imparted nowadays to the function of each gene separately. For this reason, it is very significant to study gene networks. In recent years, the problem of inferring gene association networks using various techniques has been tackled, however, despite these efforts, even a significant degree of accuracy is not achieved by inferring networks. That is why an algorithm for inference of gene networks based on a genetic algorithm that takes into account that many of the biological networks characterized so far experimentally, adjust to the free scale and small world graphs topology. As a result, this algorithm achieves to infer gene networks with high accuracy and maintaining the biological sense.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Redes de Genes]]></kwd>
<kwd lng="es"><![CDATA[Algoritmo Genético]]></kwd>
<kwd lng="es"><![CDATA[Inferencia]]></kwd>
<kwd lng="es"><![CDATA[Topología de Grafos]]></kwd>
<kwd lng="en"><![CDATA[Gene Networks]]></kwd>
<kwd lng="en"><![CDATA[Genetic Algorithm]]></kwd>
<kwd lng="en"><![CDATA[Inference]]></kwd>
<kwd lng="en"><![CDATA[Graph Topology]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Inferencia  de redes de asociaci&oacute;n de genes empleando algoritmos gen&eacute;ticos y topolog&iacute;a de  grafos</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><em><font face="Verdana, Arial, Helvetica, sans-serif">Inference of gene association  networks using genetic algorithms and graph topology</font></em></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Liuben L&oacute;pez Aparicio<strong><sup>1*</sup></strong>, Cosme E. Santiesteban-Toca<strong><sup>1</sup></strong>, Ra&uacute;l Gir&aacute;ldez Rojo</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup></strong></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup>Centro de Bioplantas, Universidad  M&aacute;ximo G&oacute;mez B&aacute;ez, Ciego de &Aacute;vila, Carretera a Mor&oacute;n, Km 9&frac12;, Cuba, {liuben,  cosme}@bioplantas.cu </font><font size="2" face="Verdana, Arial, Helvetica, sans-serif">    <br>     <sup>2</sup>Universidad Pablo de Olavide,  Sevilla, Espa&ntilde;a, Carretera a Utrera, rgirroj@upo.es    ]]></body>
<body><![CDATA[<br> </font></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span></font><font size="2" face="Verdana, Arial, Helvetica, sans-serif"> <a href="mailto:liuben@bioplantas.cu">liuben@bioplantas.cu</a><a href="mailto:jova@uci.cu"></a></font><font face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:losorio@ismm.edu.cu"></a> </font>     <p>&nbsp;</p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Debido a que existe un gran n&uacute;mero de enfermedades de naturaleza poligen&eacute;tica,  en la actualidad se confiere mayor importancia al resultado de la interacci&oacute;n  gen&eacute;tica que a la funci&oacute;n de cada gen por separado. Por este motivo es muy  significativo el estudio de las redes de genes. En los &uacute;ltimos a&ntilde;os se ha  afrontado el problema de inferir redes de asociaci&oacute;n de genes mediante diversas  t&eacute;cnicas, sin embargo, a pesar de estos esfuerzos, aun no se logra un grado  significativo de precisi&oacute;n al inferir las redes. Es por ello que se propone un  algoritmo de inferencia de redes de genes basado en un algoritmo gen&eacute;tico que  toma en cuenta que muchas de las redes biol&oacute;gicas caracterizadas de forma  experimental se ajustan a la topolog&iacute;a de grafos libres de escala y de mundo  peque&ntilde;o. Como resultado, este algoritmo logra inferir redes de genes con una alta  precisi&oacute;n y manteniendo el sentido biol&oacute;gico.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Redes de Genes, Algoritmo Gen&eacute;tico, Inferencia, Topolog&iacute;a de Grafos.</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Because of the existence of a large number of diseases of polygenic  nature, a greater importance to the result of genetic interaction is imparted nowadays  to the function of each gene separately. For this reason, it is very  significant to study gene networks. In recent years, the problem of inferring  gene association networks using various techniques has been tackled, however,  despite these efforts, even a significant degree of accuracy is not achieved by  inferring networks. That is why an algorithm for inference of gene networks  based on a genetic algorithm that takes into account that many of the  biological networks characterized so far experimentally, adjust to the free  scale and small world graphs topology. As a result, this algorithm achieves to  infer gene networks with high accuracy and maintaining the biological sense.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>Gene Networks, Genetic Algorithm, Inference, Graph Topology.</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El estudio de enfermedades mono g&eacute;nicas ha alcanzado  sus l&iacute;mites, fallando en el tratamiento de enfermedades complejas, en el dise&ntilde;o  de f&aacute;rmacos y en el desarrollo de terapias g&eacute;nicas. Motivos que han estimulado  el desarrollo de la biolog&iacute;a molecular de sistemas donde se observa de forma  global los procesos biol&oacute;gicos. Tecnolog&iacute;as como el <em>microarray</em> (Tseng, Ghosh y Feingold 2012), (Breman et&nbsp;al. 2012), (Wang y Li 2011) y (Robinson, McCarthy y Smyth 2010) juegan un papel  fundamental en este sentido debido a que mediante estos se puede monitorizar el  nivel de expresi&oacute;n de miles de genes simult&aacute;neamente, incluso de todo el genoma  de un organismo. Por otra parte, el an&aacute;lisis de los <em>microarrays</em> y la extracci&oacute;n de informaci&oacute;n valiosa de estos, como  pudiera ser determinar genes reguladores o una red de coexpresi&oacute;n de genes, es  una tarea engorrosa debido al gran volumen de datos que estos contienen.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las redes de coexpresi&oacute;n de genes o redes de genes se  describen matem&aacute;ticamente como un grafo conexo donde los nodos representan  genes y las aristas representan interacciones entre genes, en donde se define  que genes presentaran actividad en dependencia de la acci&oacute;n de otros genes.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Muchas de las redes biol&oacute;gicas  complejas (Costanzo et&nbsp;al. 2016)  caracterizadas de forma experimental hasta la fecha cumplen la propiedad de ser  libre de escala y de mundo peque&ntilde;o.  Donde, una red libre de escala es un tipo espec&iacute;fico de grafo donde algunos  nodos est&aacute;n altamente conectados, es decir, algunos nodos poseen un gran n&uacute;mero  de enlaces a otros nodos, aunque el grado de conexi&oacute;n de casi todos los nodos  es bastante bajo. Y una red de mundo peque&ntilde;o es un tipo de grafo donde la  mayor&iacute;a de los nodos no son vecinos entre s&iacute;, pero la mayor&iacute;a de los nodos  pueden ser alcanzados desde cualquier nodo origen del grafo a trav&eacute;s de un  n&uacute;mero relativamente corto de saltos entre ellos. En el caso de la regulaci&oacute;n  gen&eacute;tica esto es apreciable debido a que se han determinado genes reguladores  (o factores de transcripci&oacute;n) que son encargados de desencadenar o inhibir la  expresi&oacute;n de varios genes y se logran procesos biol&oacute;gicos complejos con la  interacci&oacute;n de un grupo relativamente peque&ntilde;o de genes.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En los &uacute;ltimos a&ntilde;os se han  empleado varios algoritmos estoc&aacute;sticos para realizar la inferencia de redes de  genes mediante t&eacute;cnicas basadas en similitud, aprendizaje autom&aacute;tico,  probabilidad y mixtas (Madhamshettiwar et&nbsp;al. 2012), (Zhang et&nbsp;al. 2013), (Maetschke et&nbsp;al. 2014), (Michailidis y D&rsquo;Alch-Buc 2013), (Kumar, Stecher y Tamura 2016). Sin embargo, a pesar de estos esfuerzos, aun no se  logra un grado significativo de precisi&oacute;n al inferir las redes. Es por ello que  el objetivo del presente trabajo es desarrollar un algoritmo de inferencia de  redes de genes, a partir del empleo de un algoritmo gen&eacute;tico de cromosomas  variables (Kim y De Weck 2005) y el empleo de la topolog&iacute;a de redes, que sea capaz  de inferir redes con sentido biol&oacute;gico y que mantenga un alto grado de  correlaci&oacute;n entre los genes. </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">M&eacute;todo propuesto &lsquo;&lsquo;Algoritmo IRG&rsquo;&rsquo;</font></strong> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los <em>microarrays</em> donde los datos no han sido  sometidos a ning&uacute;n preprocesamiento, se caracterizan por tener muchos rasgos lo  que dificulta el procesamiento de los datos. Para reducir la dimensi&oacute;n de estos  datos sin perder informaci&oacute;n &uacute;til se realiz&oacute; un preprocesamiento siguiendo la  hip&oacute;tesis biol&oacute;gica de que: &ldquo;genes con perfiles de expresi&oacute;n similar comparten  el mismo r&eacute;gimen regulatorio&rdquo; (The GTEx Consortium et&nbsp;al. 2015). Siguiendo esta hip&oacute;tesis los  genes que se expresan de forma irregular en una muestra no ser&aacute;n significativos  para las redes a inferir y ser&aacute;n excluidos a partir de un an&aacute;lisis de entrop&iacute;a.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Lectura y preprocesamiento del <em>microarray</em></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El  preprocesamiento de los datos del <em>microarray</em> se realiza haciendo un an&aacute;lisis de la entrop&iacute;a utilizando como base la medida  estad&iacute;stica de desviaci&oacute;n est&aacute;ndar (Ecuaci&oacute;n 1 ) en b&uacute;squeda de eliminar los atributos con mayor  grado de dispersi&oacute;n. Para este proceso se tomaron un grupo de <em>microarrays</em> y se conform&oacute; con estos una  matriz num&eacute;rica de <em>MxN</em> (<a href="#f01">Figura 1</a> ) donde cada  caso corresponde a los perfiles de expresi&oacute;n gen&eacute;tica de un individuo dado y  cada rasgo los genes que se est&aacute;n cuantificando. Posteriormente se calcula la  desviaci&oacute;n est&aacute;ndar para cada rasgo, lo que produce una lista de desviaciones  est&aacute;ndar del mismo tama&ntilde;o que la cantidad de rasgos. Cada valor de esta lista  se normaliza de 0 a 1 (Ecuaci&oacute;n<strong>.</strong>2) con vista a eliminar de la  matriz aquellos rasgos que tengan un valor de desviaci&oacute;n de un 5%, o sea se van  a eliminar los que est&eacute;n por encima de 0.95 y por debajo de 0.05.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este proceso se obtienen los genes  con valores m&aacute;s centralizados y se eliminan los grupos con valores extremos.  Con los genes resultantes tras este proceso de selecci&oacute;n se construye un nuevo <em>microarray</em> que ser&aacute; sobre el que el  algoritmo de inferencia realice la extracci&oacute;n de las redes de genes.</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0103317.jpg" alt="f01" width="356" height="252"><a name="f01"></a></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/fo0103317.jpg" alt="fo01" width="263" height="108"></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/fo0203317.jpg" alt="fo02" width="305" height="93"></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">C&aacute;lculo del coeficiente de correlaci&oacute;n</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tras el preprocesamiento de los datos se calcula la correlaci&oacute;n del <em>microarray</em>. Para el c&aacute;lculo del  coeficiente de correlaci&oacute;n se utiliz&oacute; la correlaci&oacute;n de <em>Spearman</em> (Ecuaci&oacute;n  3 ).</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/fo0303317.jpg" alt="fo03" width="243" height="87"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este m&eacute;todo se  escogi&oacute; teniendo en cuenta que no es sensible ante la  dispersi&oacute;n y se utiliza para datos donde no se sabe si la distribuci&oacute;n es normal  (Eisen et&nbsp;al. 1998). Este coeficiente de correlaci&oacute;n al igual que otros se encuentra entre los  valores de &ndash;1 a 1, donde 1 es perfectamente correlacionado, 0 no correlacionado  y &ndash;1 es perfectamente correlacionado negativamente. En esta investigaci&oacute;n se  desean los genes que tengan una alta correlaci&oacute;n positiva debido a que ser&aacute;n  los que tengan un grado de coexpresi&oacute;n m&aacute;s elevado.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Obtenci&oacute;n de la matriz de adyacencia</strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La matriz de adyacencia es una matriz cuadrada que se utiliza como un  m&eacute;todo de representaci&oacute;n de relaciones binarias. Esta matriz establece la  relaci&oacute;n de todos los genes del <em>microarray</em> a partir de la correlaci&oacute;n que existe entre ellos, esto se logra penalizando  las correlaciones d&eacute;biles y maximizando las fuertes (<a href="#f02">Figura 2</a>). De esta forma, se genera un grafo global que toma como nodos a los genes  y como aristas a la relaci&oacute;n que existe entre estos. El umbral de selecci&oacute;n se  estableci&oacute; en 0.5, donde los genes que tengan una correlaci&oacute;n mayor o igual a  0.5 tendr&aacute;n relaci&oacute;n (valor 1 en la matriz de adyacencia), y los que tengan una  correlaci&oacute;n inferior a 0.5 no tendr&aacute;n relaci&oacute;n (valor 0 la matriz de  adyacencia).</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0203317.jpg" alt="f02" width="534" height="225"><a name="f02"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Modelo propuesto para la inferencia</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La soluci&oacute;n que se presenta en este trabajo utiliza como  modelo de inferencia un algoritmo gen&eacute;tico. Los algoritmos gen&eacute;ticos establecen  una analog&iacute;a entre el conjunto de soluciones de un problema, llamado fenotipo,  y el conjunto de individuos de una poblaci&oacute;n natural, codificando la  informaci&oacute;n de cada soluci&oacute;n en una cadena, llamada cromosoma. Los s&iacute;mbolos que  forman la cadena son llamados los genes. Los cromosomas evolucionan a trav&eacute;s de  iteraciones, llamadas generaciones. En cada generaci&oacute;n, los cromosomas son  evaluados usando alguna medida de aptitud o funci&oacute;n de <em>fitness</em>. Las siguientes generaciones de cromosomas, llamada  descendencia, se forman utilizando los operadores gen&eacute;ticos de cruzamiento y de  mutaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Codificaci&oacute;n del vector de entrada</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El vector de entrada ser&aacute; de longitud variable o sea  son redes de genes de longitudes diferentes. Este vector se descompone en 2  partes: una lista de tuplas, donde cada tupla tienen dos genes y la correlaci&oacute;n  entre ambos, y la medida de calidad de la red (<em>fitness</em>) (Funci&oacute;n 1). En la  siguiente figura (<a href="#f03">Figura 3</a>). Se muestra la  estructura de una red de genes. El c&aacute;lculo y selecci&oacute;n de los valores que  conforman esta estructura se explica a continuaci&oacute;n.</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0303317.jpg" alt="f03" width="449" height="213"><a name="f03"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Inicializaci&oacute;n de la poblaci&oacute;n</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para generar la poblaci&oacute;n inicial se determina la  cantidad de cromosomas que la conformar&aacute;n y se procede a crear estos  cromosomas. Para generar cada cromosoma se ir&aacute; tomando aleatoria y c&iacute;clicamente  una cantidad determinada de genes del espacio y se evaluar&aacute; si son aptos para  formar la red. Los genes que formar&aacute;n un cromosoma son aptos cuando en la menor  cantidad de estos est&eacute;n la mayor&iacute;a de las aristas o conexiones (grado de  conexi&oacute;n), a los que se les denomina como nodos centrales o <em>hubs</em> (<a href="/img/revistas/rcci/v11n3/f0403317.jpg" target="_blank">Figura 4</a>).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para esto entre los genes seleccionados se busca el grado  de conexi&oacute;n de cada uno con el resto, mediante la matriz de adyacencia y si  cumplen con la propiedad descrita anteriormente, se procede a generar las  aristas entre ellos. Las aristas se encuentran establecidas en la matriz de  adyacencia, de modo que cada gen tendr&aacute; conexi&oacute;n con el resto de los seleccionados  en base a la matriz de adyacencia. Una caracter&iacute;stica que debe seguir el grafo  generado (cromosoma) es que debe ser conexo, de modo que si fuera seleccionado  un gen que no tenga relaci&oacute;n con ning&uacute;n otro del cromosoma se enlaza con el que  mayor correlaci&oacute;n tenga seg&uacute;n la matriz de correlaci&oacute;n. Esto generar&aacute; un grafo  que cumple con la propiedad de ser libre de escala donde el peso de las aristas  ser&aacute; la correlaci&oacute;n que existe entre esos dos nodos seg&uacute;n la matriz de  correlaci&oacute;n.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En este punto cada cromosoma corresponde a un vector de  entrada que tendr&aacute; una lista de tuplas que describen una arista de un grafo y  el peso de esta arista (<a href="#f03">Figura 3</a>).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Evaluaci&oacute;n de la poblaci&oacute;n inicial</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La evaluaci&oacute;n de la poblaci&oacute;n inicial (cromosomas) se  realizar&aacute; en funci&oacute;n de dos par&aacute;metros: el ajuste a la topolog&iacute;a (libre escala  y mundo peque&ntilde;o), y el grado de correlaci&oacute;n media del grafo. Por lo que el  valor de <em>fitness</em> de los cromosomas  depender&aacute; del ajuste a estos dos par&aacute;metros. Para esto se dise&ntilde;&oacute; la siguiente  funci&oacute;n de <em>fitness</em>:</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/fo0403317.jpg" alt="fo04" width="432" height="75"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Donde <img src="/img/revistas/rcci/v11n3/fo0503317.jpg" alt="fo05" width="11" height="15">, <img src="/img/revistas/rcci/v11n3/fo0603317.jpg" alt="fo06" width="14" height="17"> y <img src="/img/revistas/rcci/v11n3/fo0703317.jpg" alt="fo07" width="15" height="16">son constantes ajustables  (seg&uacute;n la bondad de ajuste calculada <img src="/img/revistas/rcci/v11n3/fo0503317.jpg" alt="fo05" width="11" height="15"> = 0.5 , <img src="/img/revistas/rcci/v11n3/fo0603317.jpg" alt="fo06" width="14" height="17"> = 0.25 y <img src="/img/revistas/rcci/v11n3/fo0703317.jpg" alt="fo07" width="15" height="16">=0.25) que sumadas deben dar 1. Esto  tiene como objetivo darle un valor de importancia a cada componente de la  funci&oacute;n y a su vez normalizar los valores de <em>fitness</em> de las redes, debido a que las redes son de tama&ntilde;o variable  y por lo tanto el valor de <em>fitness</em> podr&iacute;a ser afectado por el tama&ntilde;o del grafo (red de genes).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><img src="/img/revistas/rcci/v11n3/fo0803317.jpg" alt="fo08" width="18" height="21"><strong>(Correlaci&oacute;n) </strong><em>Correlaci&oacute;n Media</em>: viene dada por el c&aacute;lculo de la media de las correlaciones de todas  las aristas del grafo. Mientras mayor sea el valor de la <img src="/img/revistas/rcci/v11n3/fo0803317.jpg" alt="fo08" width="18" height="21"><strong>(Correlaci&oacute;n)</strong> , mayor ser&aacute; el valor de <em>fitness</em> del cromosoma que se est&aacute; evaluando. Esta medida es la que  m&aacute;s peso tiene en la funci&oacute;n debido a que la correlaci&oacute;n muestra el grado de  coexpresi&oacute;n entre los genes y se desean redes con un alto grado de coexpresi&oacute;n  entre sus nodos, la correlaci&oacute;n de cada par de genes debe tener el mayor valor  posible para maximizar la funci&oacute;n de evaluaci&oacute;n. </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Md(Grado) </font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><em>Grado de Moda</em>: viene dado por  el c&aacute;lculo de la moda de los grados de todos los nodos del grafo. Debido a que  en las redes libres de escala la mayor&iacute;a de las aristas est&aacute;n en pocos nodos,  la mayor&iacute;a de los nodos tienen pocas aristas y por lo tanto un grado peque&ntilde;o,  por lo cual mientras menor es el grado de moda m&aacute;s se va a maximizar la funci&oacute;n  de <em>fitness</em>.</font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><img src="/img/revistas/rcci/v11n3/fo0803317.jpg" alt="fo08" width="18" height="21"><strong>(camino_m&iacute;nimo)</strong></font> <font size="2"><em><font face="Verdana, Arial, Helvetica, sans-serif">Camino M&iacute;nimo  Medio</font></em><font face="Verdana, Arial, Helvetica, sans-serif">: viene dado por el c&aacute;lculo de la media de las distancias de los caminos  m&iacute;nimos de un nodo a todos los nodos de la red. Los caminos m&iacute;nimos se calculan  mediante el algoritmo de <em>Dijkstra</em> (Dijkstra 1959). Debido a que en las redes de  mundo peque&ntilde;o se puede ir de un nodo a otro con pocos saltos, el camino medio  debe ser peque&ntilde;o para que la red cumpla esta propiedad, por lo cual mientras  menor es el camino medio de la red m&aacute;s se va a maximizar la funci&oacute;n de <em>fitness</em>.</font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los valores resultantes de la evaluaci&oacute;n de estas  redes a trav&eacute;s de la funci&oacute;n de <em>fitness</em> se encuentran normalizados en un rango de 0 a 1, siendo m&aacute;s aptas las que posean  un valor m&aacute;s elevado. Tras el c&aacute;lculo del <em>fitness</em> de la poblaci&oacute;n inicial, se almacena su valor seg&uacute;n se muestra en la  codificaci&oacute;n del vector de entrada (<a href="#f03">Figura 3</a>). </font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Cruzamiento de los cromosomas</font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El cruce o recombinaci&oacute;n de los cromosomas de la  poblaci&oacute;n inicial se realiza tomando pares de cromosomas y cruz&aacute;ndolas por un  determinado criterio. El criterio que se implement&oacute; es la recombinaci&oacute;n en un  punto.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para esto se selecciona el punto medio de dos cromosomas padres y se  combinan los fragmentos de forma tal que a partir de dos cromosomas padres se  van a generar cuatro hijos (<a href="/img/revistas/rcci/v11n3/f0503317.jpg" target="_blank">Figura 5</a>).</font> </p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tomando en cuenta que estos cromosomas describen un  grafo, si tras el proceso de recombinaci&oacute;n este queda desconectado se  reorganiza el grafo buscando que quede conexo. Esto se realiza examinando en  los dos fragmentos de cromosoma padre que conforman el cromosoma hijo los nodos  que quedan m&aacute;s cercanos seg&uacute;n la matriz de adyacencia y enlaz&aacute;ndolos en una  nueva tupla que se le agrega al cromosoma hijo. Tras el cruzamiento de los  padres los hijos generados se les calculan el valor de <em>fitness</em> y se almacena este valor en el cromosoma (vector de  entrada, <a href="#f03">Figura 3</a>).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Mutaci&oacute;n de los cromosomas hijos</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La mutaci&oacute;n ocurre sobre los hijos en base a una  probabilidad estad&iacute;stica por lo general muy baja. Este valor se encuentra entre  cero y cien (5 por ciento para este caso). La estrategia de mutaci&oacute;n que se  implement&oacute; consisti&oacute; en cambiar un nodo central (A) por otro nodo  (B) con similar centralidad, posteriormente se estableci&oacute; una conexi&oacute;n entre  los nodos adyacentes al nodo (A) con el nodo (B), bas&aacute;ndose en la matriz de  adyacencia. Posteriormente se eliminaron del grafo los  nodos que estaban enlazados con el nodo (A) y no tienen relaci&oacute;n, seg&uacute;n la  matriz de adyacencia con el nodo (B). Este proceso de mutaci&oacute;n va a generar  saltos en el espacio de b&uacute;squeda lo que evitar&aacute; que converja r&aacute;pidamente a  &oacute;ptimos locales. Cuando sucede la mutaci&oacute;n se eval&uacute;a nuevamente los cromosomas  mutados en busca del nuevo valor de <em>fitness,</em> a estos cromosomas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Selecci&oacute;n de la pr&oacute;xima generaci&oacute;n</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La selecci&oacute;n de la pr&oacute;xima generaci&oacute;n se implement&oacute;  mediante el m&eacute;todo de la ruleta. Este m&eacute;todo consiste en crear una lista con  cien posiciones, donde se asignar&aacute; cada cromosoma una cantidad determinada de  veces a la ruleta en funci&oacute;n de su valor de <em>fitness</em>.  Para esto se unen los cromosomas padres con los hijos en una sola lista, donde  cada cromosoma tendr&aacute; una probabilidad de ser seleccionado para la nueva  generaci&oacute;n en dependencia de su valor de <em>fitness</em>.  O sea, mientras mayor sea el valor de <em>fitness</em> de un cromosoma m&aacute;s posiciones va a ocupar en la ruleta, por lo que tendr&aacute;  mayor posibilidad de ser seleccionada, pero como este proceso es  pseudoaleatorio pude ser seleccionada una menos apta. De esta lista se va a  seleccionar la misma cantidad de cromosomas que hab&iacute;a en la poblaci&oacute;n inicial y  ser&aacute;n los que la sustituyan, pasando a ser la nueva generaci&oacute;n que utilizar&aacute; el  algoritmo para la pr&oacute;xima iteraci&oacute;n. Esto tiene como objetivo evitar la  convergencia demasiado r&aacute;pida a una soluci&oacute;n local y as&iacute; reducir el encuentro  de falsos descubrimientos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Condici&oacute;n de parada del algoritmo gen&eacute;tico</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La condici&oacute;n de parada est&aacute; dada, primeramente, por el <em>fitness</em> de las redes. Por cada  generaci&oacute;n se conoce la red que mayor valor de <em>fitness</em> posee e inicialmente se introduce un valor que se va a  utilizar como condici&oacute;n de parada o umbral (0.8 para este caso). Cuando una red  posea un valor de <em>fitness</em> superior al  establecido como umbral el algoritmo gen&eacute;tico dejar&aacute; de crear nuevas  generaciones y se devolver&aacute;n todas las generaciones destacando el mejor  cromosoma por cada una de ellas.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la condici&oacute;n de parada se establece como segunda  opci&oacute;n por la cantidad m&aacute;xima de generaciones. Si suceden una cantidad de  generaciones determinada (100 para este caso) y los valores de <em>fitness</em> de los cromosomas generados no  alcanzan el valor esperado el proceso debe terminar debido a que estos modelos  pueden estar creando nuevas generaciones indefinidamente. Esto es usual para <em>microarrays</em> con una baja correlaci&oacute;n de  sus genes o por un inadecuado c&aacute;lculo de la bondad de ajuste del algoritmo para  un determinado <em>microarray</em>.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Evaluaci&oacute;n experimental</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la evaluaci&oacute;n experimental del algoritmo, se utiliz&oacute;  un grupo de bases de datos del repositorio la Universidad Tecnol&oacute;gica de  Nanyang, Singapur. Este repositorio en l&iacute;nea con  direcci&oacute;n <a href="http://sdmc.lit.org.sg/GEDatasets/Datasets.html">http://sdmc.lit.org.sg/GEDatasets/Datasets.html</a>,  brinda datos biom&eacute;dicos de alta dimensi&oacute;n, incluyendo los datos  de expresi&oacute;n g&eacute;nica. Estas bases de datos fueron seleccionadas debido a que son  muy referenciadas y sus datos no han sido sometidos a ning&uacute;n an&aacute;lisis.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se utilizaron  bases de datos de texto plano de diversa naturaleza, como: <em>Ovarian Cancer </em>(Ovarian), <em>MLL </em>(MLL), <em>ALL-AML Leukemia </em>(Leu 2C), <em>Bcell-Tcell-AML Leukemia </em>(Leu 3C), <em>Bcell-Tcell-BM-PB Leukemia </em>(Leu 4C), <em>Yeast y Central Nervous System </em>(CNS).  Las bases de datos pertenecen a perfiles de expresi&oacute;n gen&eacute;tica extra&iacute;das de un  grupo de organismos sanos o enfermos expresados en <em>microarrays</em><a>.</a></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>An&aacute;lisis de la calidad de las redes obtenidas</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el an&aacute;lisis de la experimentaci&oacute;n se separaron  las bases de datos seg&uacute;n las dimensiones de sus datos en: peque&ntilde;as (menos de  5000 genes), medianas (de 5000 a 10000 genes) y grandes (m&aacute;s de 10000 genes),  esta distribuci&oacute;n se mostrar&aacute; en la figura encerrando cada grupo seg&uacute;n su  tama&ntilde;o en un rect&aacute;ngulo (<a href="#f06">Figura  6</a>).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Teniendo en cuenta que lo que  se desea en maximizar el valor de <em>fitness</em>,  el algoritmo tuvo un mejor comportamiento en bases de datos de gran dimensi&oacute;n,  debido a que en estas fue donde se extrajeron redes con un valor de <em>fitness</em> m&aacute;s elevado. Igualmente se  extrajeron redes con un elevado valor de <em>fitness</em> en bases de datos de peque&ntilde;a dimensi&oacute;n con valores superiores a 0.8. Los  resultados m&aacute;s discretos se obtuvieron en bases de datos de mediana dimensi&oacute;n,  aunque no fueron cr&iacute;ticos con respecto a los resultados obtenidos en bases de  datos de peque&ntilde;a y gran dimensi&oacute;n. </font></p>     <p align="center"><img src="/img/revistas/rcci/v11n3/f0603317.jpg" alt="f06" width="565" height="325"><a name="f06"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Gr&aacute;fico de las mejores redes obtenidas</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A continuaci&oacute;n,  se muestran las redes obtenidas por el algoritmo <strong><em>IRG</em></strong> para las bases de  datos: <em>Yeast, Central Nervous System </em>(CNS), <em>MLL </em>(MLL) y <em>Ovarian Cancer </em>(Ovarian).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las redes  obtenidas son de diferentes dimensiones y el valor de <em>fitness</em> bar&iacute;a de una a otra. En la aplicaci&oacute;n asociada al algoritmo  se puede graficar las redes como se muestra a continuaci&oacute;n y se obtiene  informaci&oacute;n concreta como: que genes son los que conforman la red, cantidad de  nodos y aristas, nodos centrales o posibles factores de transcripci&oacute;n de la  red, as&iacute; como facilidades interactivas de organizaci&oacute;n y reorganizaci&oacute;n de la  red, y especificaciones de los genes involucrados.</font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a href="/img/revistas/rcci/v11n3/f0703317.jpg" target="_blank">Ver Figuras 7, 8, 9, 10 </a></font></p>     ]]></body>
<body><![CDATA[<p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Mecanismo de interpretaci&oacute;n</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El mecanismo de interpretaci&oacute;n del algoritmo viene dado por la codificaci&oacute;n  del vector que se usa para representar una red o grafo, y por la posibilidad de  graficar este vector en una herramienta asociada, lo que permite a los  especialistas realizar su experimentaci&oacute;n en funci&oacute;n de los genes por  individual o por grupos (cl&uacute;steres formados alrededor de un Nodo Central). Si  se toma en cuenta que las experimentaciones gen&eacute;ticas por lo general son de  forma exhaustiva, en funci&oacute;n de un grupo de genes que se sospecha est&aacute;n  involucrados en un proceso biol&oacute;gico, el tiempo que puede tardar un  investigador en determinar los genes que intervienen en el proceso estudiado es  muy extenso. Si a esto se suma que puede ser un grupo de esos genes  coexpres&aacute;ndose y que el problema ser&iacute;a combinatorio es casi imposible de hallar  una soluci&oacute;n en un tiempo razonable.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Usando una de estas redes como  modelo a seguir para realizar la experimentaci&oacute;n el tiempo se debe reducir  considerablemente, debido a que los genes en la vecindad tienen un alto grado  de posibilidad de estar involucrados en el mismo proceso, ya que se est&aacute;n  expresando de una forma similar cuantitativamente seg&uacute;n lo expuesto en la base  biol&oacute;gica de la que partimos en la investigaci&oacute;n (genes con perfiles de  expresi&oacute;n similar comparten el mismo r&eacute;gimen regulatorio). </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se desarroll&oacute; un algoritmo de inferencia de redes de asociaci&oacute;n de genes,  empleando t&eacute;cnicas evolutivas y gen&eacute;ticas, que es capaz de inferir redes con  sentido biol&oacute;gico desde el punto de vista de la topolog&iacute;a de grafos empleada y  que mantienen un alto grado de correlaci&oacute;n entre los genes.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se propuso una nueva medida de  evaluaci&oacute;n de las redes de genes, basada en las caracter&iacute;sticas topol&oacute;gicas y  el nivel de correlaci&oacute;n que &eacute;sta alcanza, que se ajusta a los principios  biol&oacute;gicos de la interacci&oacute;n gen&eacute;tica.</font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>A</B><strong>GRADECIMIENTOS </strong></font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Al Laboratorio de Bioinform&aacute;tica del Centro de  Bioplantas, en Ciego de &Aacute;vila, Cuba</font>.</p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS  BIBLIOGR&Aacute;FICAS</B></font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BREMAN, A., PURSLEY,  A.N., HIXSON, P., BI, W., WARD, P., BACINO, C.A., SHAW, C., LUPSKI, J.R.,  BEAUDET, A., PATEL, A., CHEUNG, S.W. y VAN DEN VEYVER, I., 2012. Prenatal  chromosomal microarray analysis in a diagnostic laboratory; experience with  &gt;1000 cases and review of the literature. <em>Prenatal Diagnosis</em>, vol.  32, no. 4, pp. 351-361. ISSN 01973851. DOI 10.1002/pd.3861. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">COSTANZO, M.,  VANDERSLUIS, B., KOCH, E.N., BARYSHNIKOVA, A., PONS, C., TAN, G., WANG, W.,  USAJ, M., HANCHARD, J., LEE, S.D., PELECHANO, V., STYLES, E.B., BILLMANN, M.,  VAN LEEUWEN, J., VAN DYK, N., LIN, Z.-Y., KUZMIN, E., NELSON, J., PIOTROWSKI,  J.S., SRIKUMAR, T., BAHR, S., CHEN, Y., DESHPANDE, R., KURAT, C.F., LI, S.C.,  LI, Z., USAJ, M.M., OKADA, H., PASCOE, N., SAN LUIS, B.-J., SHARIFPOOR, S.,  SHUTERIQI, E., SIMPKINS, S.W., SNIDER, J., SURESH, H.G., TAN, Y., ZHU, H.,  MALOD-DOGNIN, N., JANJIC, V., PRZULJ, N., TROYANSKAYA, O.G., STAGLJAR, I., XIA,  T., OHYA, Y., GINGRAS, A.-C., RAUGHT, B., BOUTROS, M., STEINMETZ, L.M., MOORE,  C.L., ROSEBROCK, A.P., CAUDY, A.A., MYERS, C.L., ANDREWS, B. y BOONE, C., 2016.  A global genetic interaction network maps a wiring diagram of cellular  function. <em>Science</em> [en l&iacute;nea], vol. 353, no. 6306, pp. aaf1420-aaf1420. ISSN  0036-8075. DOI 10.1126/science.aaf1420. Disponible en:  http://www.sciencemag.org/cgi/doi/10.1126/science.aaf1420. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DIJKSTRA, E.W.,  1959. A note on two problems in connexion with graphs. <em>SpringerLink</em>,     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">EISEN, M., SPELLMAN,  P.T., BROWN, P.O. y BOTSTEIN, D., 1998. Cluster analysis and display of  genome-wide expression patterns. <em>National Academy of Sciences of the United  States of America</em>,     </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KIM, I.Y. y DE WECK, O.L., 2005. Variable chromosome length genetic  algorithm for progressive refinement in topology optimization. <em>Structural  and Multidisciplinary Optimization</em>, vol. 29, no. 6, pp. 445-456. ISSN  1615147X. DOI 10.1007/s00158-004-0498-5. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">KUMAR, S., STECHER,  G. y TAMURA, K., 2016. MEGA7&#8239;: Molecular Evolutionary Genetics Analysis Version  7 . 0 for Bigger Datasets Brief communication. <em>MBE</em>, pp. 1-5. DOI  10.1093/molbev/msw054.     </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MADHAMSHETTIWAR,  P.B., MAETSCHKE, S.R., DAVIS, M.J., REVERTER, A. y RAGAN, M.A., 2012. Gene  regulatory network inference: evaluation and application to ovarian cancer  allows the prioritization of drug targets. <em>Genome Medicine</em> [en l&iacute;nea], vol.  4, no. 5, pp. 41. ISSN 1756-994X. DOI 10.1186/gm340. Disponible en:  http://genomemedicine.biomedcentral.com/articles/10.1186/gm340. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MAETSCHKE, S.R., MADHAMSHETTIWAR, P.B., DAVIS, M.J. y RAGAN, M.A., 2014. Supervised,  semi-supervised and unsupervised inference of gene regulatory networks. <em>Briefings  in Bioinformatics</em>, vol. 15, no. 2, pp. 195-211. ISSN 14774054. DOI  10.1093/bib/bbt034. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MICHAILIDIS, G. y  D&rsquo;ALCH-BUC, F., 2013. Autoregressive models for gene regulatory network  inference: Sparsity, stability and causality issues. <em>Mathematical Biosciences</em> [en l&iacute;nea], vol. 246, no. 2, pp. 326-334. ISSN 00255564. DOI  10.1016/j.mbs.2013.10.003. Disponible en:  http://dx.doi.org/10.1016/j.mbs.2013.10.003. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ROBINSON, M.D.,  MCCARTHY, D.J. y SMYTH, G.K., 2010. edgeR: A Bioconductor package for  differential expression analysis of digital gene expression data. <em>Bioinformatics</em>,  vol. 26, no. 1, pp. 139-140. ISSN 13674803. DOI 10.1093/bioinformatics/btp616. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">THE GTEX CONSORTIUM,  WELTER, D., MACARTHUR, J., MORALES, J., BURDETT, T., HALL, P., JUNKINS, H.,  KLEMM, A., FLICEK, P., MANOLIO, T., HINDORFF, L., PARKINSON, H., VISSCHER,  P.M., BROWN, M.A., MCCARTHY, M.I., YANG, J., STRANGER, B.E., STAHL, E.A., RAJ,  T., WARD, L.D., KELLIS, M., MAURANO, M.T., HUMBERT, R., RYNES, E., THURMAN,  R.E., HAUGEN, E. y ET, A., 2015. The Genotype-Tissue Expression (GTEx) pilot  analysis: multitissue gene regulation in humans. <em>Science</em> [en l&iacute;nea], vol. 348, no.  6235, pp. 648-60. ISSN 1095-9203. DOI 10.1126/science.1262110. Disponible en:  http://www.ncbi.nlm.nih.gov/pubmed/25954001%5Cnhttp://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=PMC4547484. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">TSENG, G.C., GHOSH,  D. y FEINGOLD, E., 2012. Comprehensive literature review and statistical  considerations for microarray meta-analysis. <em>Nucleic Acids Research</em>,  vol. 40, no. 9, pp. 3785-3799. ISSN 03051048. DOI 10.1093/nar/gkr1265. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WANG, L. y LI, P.C.H., 2011. Microfluidic DNA microarray analysis:  A review. <em>Analytica Chimica Acta</em> [en l&iacute;nea], vol. 687, no. 1, pp. 12-27. ISSN 00032670. DOI  10.1016/j.aca.2010.11.056. Disponible en:  http://dx.doi.org/10.1016/j.aca.2010.11.056.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ZHANG, X.,  LIU, K., LIU, Z.P., DUVAL, B., RICHER, J.M., ZHAO, X.M., HAO, J.K. y CHEN, L.,  2013. NARROMI: A  noise and redundancy reduction technique improves accuracy of gene regulatory  network inference. <em>Bioinformatics</em>, vol. 29, no. 1, pp. 106-113. ISSN  13674803. DOI 10.1093/bioinformatics/bts619.</font></p>     <p name="_ENREF_1">&nbsp;</p>     ]]></body>
<body><![CDATA[<p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 20/05/2017    <br> Aceptado: 25/06/2017</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BREMAN]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[PURSLEY]]></surname>
<given-names><![CDATA[A.N]]></given-names>
</name>
<name>
<surname><![CDATA[HIXSON]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[BI]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[WARD]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[BACINO]]></surname>
<given-names><![CDATA[C.A]]></given-names>
</name>
<name>
<surname><![CDATA[SHAW]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[LUPSKI]]></surname>
<given-names><![CDATA[J.R]]></given-names>
</name>
<name>
<surname><![CDATA[BEAUDET]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[PATEL]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[CHEUNG]]></surname>
<given-names><![CDATA[S.W]]></given-names>
</name>
<name>
<surname><![CDATA[VAN DEN VEYVER]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Prenatal chromosomal microarray analysis in a diagnostic laboratory; experience with >1000 cases and review of the literature.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 32</volume>
<numero>no. 4</numero>
<issue>no. 4</issue>
<page-range>351-361</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[COSTANZO]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[VANDERSLUIS]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[KOCH]]></surname>
<given-names><![CDATA[E.N]]></given-names>
</name>
<name>
<surname><![CDATA[BARYSHNIKOVA]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[PONS]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[TAN]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[WANG]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[USAJ]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[HANCHARD]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[LEE]]></surname>
<given-names><![CDATA[S.D]]></given-names>
</name>
<name>
<surname><![CDATA[PELECHANO]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[STYLES]]></surname>
<given-names><![CDATA[E.B]]></given-names>
</name>
<name>
<surname><![CDATA[BILLMANN]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[VAN LEEUWEN]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[PASCOE]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[SAN LUIS]]></surname>
<given-names><![CDATA[B.-J]]></given-names>
</name>
<name>
<surname><![CDATA[SHARIFPOOR]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[ANDREWS]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[BOONE]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A global genetic interaction network maps a wiring diagram of cellular function.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 353</volume>
<numero>no. 6306</numero>
<issue>no. 6306</issue>
<page-range>aaf1420-aaf1420</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DIJKSTRA]]></surname>
<given-names><![CDATA[E.W]]></given-names>
</name>
</person-group>
<source><![CDATA[A note on two problems in connexion with graphs.]]></source>
<year>1959</year>
<publisher-name><![CDATA[SpringerLink]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[EISEN]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[SPELLMAN]]></surname>
<given-names><![CDATA[P.T]]></given-names>
</name>
<name>
<surname><![CDATA[BROWN]]></surname>
<given-names><![CDATA[P.O]]></given-names>
</name>
<name>
<surname><![CDATA[BOTSTEIN]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Cluster analysis and display of genome-wide expression patterns. National Academy of Sciences of the United States of America]]></source>
<year>1998</year>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KIM]]></surname>
<given-names><![CDATA[I.Y]]></given-names>
</name>
<name>
<surname><![CDATA[DE WECK]]></surname>
<given-names><![CDATA[O.L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Variable chromosome length genetic algorithm for progressive refinement in topology optimization]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 29,</volume>
<numero>no. 6</numero>
<issue>no. 6</issue>
<page-range>445-456</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KUMAR]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[STECHER]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[TAMURA]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[MEGA7: Molecular Evolutionary Genetics Analysis Version 7 . 0 for Bigger Datasets Brief communication]]></source>
<year>2016</year>
<page-range>1-5</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MADHAMSHETTIWAR]]></surname>
<given-names><![CDATA[P.B]]></given-names>
</name>
<name>
<surname><![CDATA[MAETSCHKE]]></surname>
<given-names><![CDATA[S.R]]></given-names>
</name>
<name>
<surname><![CDATA[DAVIS]]></surname>
<given-names><![CDATA[M.J]]></given-names>
</name>
<name>
<surname><![CDATA[REVERTER]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[RAGAN]]></surname>
<given-names><![CDATA[M.A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Gene regulatory network inference:: evaluation and application to ovarian cancer allows the prioritization of drug targets.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 4</volume>
<numero>no. 5</numero>
<issue>no. 5</issue>
<page-range>pp. 41</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MAETSCHKE]]></surname>
<given-names><![CDATA[S.R]]></given-names>
</name>
<name>
<surname><![CDATA[MADHAMSHETTIWAR]]></surname>
<given-names><![CDATA[P.B]]></given-names>
</name>
<name>
<surname><![CDATA[DAVIS]]></surname>
<given-names><![CDATA[M.J]]></given-names>
</name>
<name>
<surname><![CDATA[RAGAN]]></surname>
<given-names><![CDATA[M.A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Supervised, semi-supervised and unsupervised inference of gene regulatory networks]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 15</volume>
<numero>no. 2,</numero>
<issue>no. 2,</issue>
<page-range>195-211</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MICHAILIDIS]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[D&#8217;ALCH-BUC]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Autoregressive models for gene regulatory network inference: Sparsity, stability and causality issues.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 246</volume>
<numero>no. 2</numero>
<issue>no. 2</issue>
<page-range>326-334</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ROBINSON]]></surname>
<given-names><![CDATA[M.D]]></given-names>
</name>
<name>
<surname><![CDATA[MCCARTHY]]></surname>
<given-names><![CDATA[D.J]]></given-names>
</name>
<name>
<surname><![CDATA[SMYTH]]></surname>
<given-names><![CDATA[G.K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[edgeR: A Bioconductor package for differential expression analysis of digital gene expression data]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 26</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>139-140</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WELTER]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[MACARTHUR]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[FLICEK]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[MANOLIO]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[BROWN]]></surname>
<given-names><![CDATA[M.A]]></given-names>
</name>
<name>
<surname><![CDATA[MCCARTHY]]></surname>
<given-names><![CDATA[M.I]]></given-names>
</name>
<name>
<surname><![CDATA[YANG]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[STRANGER]]></surname>
<given-names><![CDATA[B.E]]></given-names>
</name>
<name>
<surname><![CDATA[WARD]]></surname>
<given-names><![CDATA[L.D]]></given-names>
</name>
<name>
<surname><![CDATA[KELLIS]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[HAUGEN]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 348</volume>
<numero>no. 6235</numero>
<issue>no. 6235</issue>
<page-range>648-60</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TSENG]]></surname>
<given-names><![CDATA[G.C]]></given-names>
</name>
<name>
<surname><![CDATA[GHOSH]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[FEINGOLD]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comprehensive literature review and statistical considerations for microarray meta-analysis.]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 40</volume>
<numero>no. 9</numero>
<issue>no. 9</issue>
<page-range>3785-3799</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WANG]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[P.C.H]]></surname>
<given-names><![CDATA[LI]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Microfluidic DNA microarray analysis: A review]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 687</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>12-27</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ZHANG]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[LIU]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[LIU]]></surname>
<given-names><![CDATA[Z.P]]></given-names>
</name>
<name>
<surname><![CDATA[DUVAL]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[RICHER]]></surname>
<given-names><![CDATA[J.M]]></given-names>
</name>
<name>
<surname><![CDATA[ZHAO]]></surname>
<given-names><![CDATA[X.M]]></given-names>
</name>
<name>
<surname><![CDATA[HAO]]></surname>
<given-names><![CDATA[J.K]]></given-names>
</name>
<name>
<surname><![CDATA[CHEN]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[NARROMI: A noise and redundancy reduction technique improves accuracy of gene regulatory network inference]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<volume>vol. 29</volume>
<numero>no. 1</numero>
<issue>no. 1</issue>
<page-range>106-113</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
