<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992017000400004</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Evaluación de proyectos usando sistemas basados en algoritmos genéticos de aprendizaje de reglas]]></article-title>
<article-title xml:lang="en"><![CDATA[Evaluation of Projects by using Genetic Rules Based Systems]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Guerrero Enamorado]]></surname>
<given-names><![CDATA[Alain]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Pérez Pupo]]></surname>
<given-names><![CDATA[Iliana]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Ventura]]></surname>
<given-names><![CDATA[Sebastián]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Morell]]></surname>
<given-names><![CDATA[Carlos]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Piñero Pérez]]></surname>
<given-names><![CDATA[Pedro Yobanis]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de las Ciencias Informáticas (UCI)  ]]></institution>
<addr-line><![CDATA[ Habana]]></addr-line>
<country>Cuba</country>
</aff>
<aff id="A">
<institution><![CDATA[,La  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad de Córdoba (UCO)  ]]></institution>
<addr-line><![CDATA[ Córdoba]]></addr-line>
<country>España</country>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad Central Marta Abreu de las Villas (UCLV)  ]]></institution>
<addr-line><![CDATA[ Santa Clara]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2017</year>
</pub-date>
<volume>11</volume>
<numero>4</numero>
<fpage>39</fpage>
<lpage>56</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992017000400004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992017000400004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992017000400004&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En el presente trabajo se evalúa el comportamiento del algoritmo evolutivo MCGEP en diferentes versiones de una base de datos con información sobre la evaluación de proyectos informáticos. La idea fundamental del trabajo es evaluar la posibilidad de aplicación de un algoritmo evolutivo que utiliza programación de expresiones genéticas frente a otros siete algoritmos muy utilizados del estado del arte. Los algoritmos utilizados en la evaluación son capaces de generar modelos de clasificación interpretables utilizando técnicas evolutivas para obtenerlos. Los experimentos se realizaron en cinco versiones creadas a partir de un repositorio de datos con información sobre la evaluación de proyectos. Se logró mostrar como el algoritmo MCGEP queda en primer lugar entre los algoritmos comparados para la métrica de exactitud predictiva, además mejora significativamente a la mayoría de estos algoritmos en esta métrica. Por otro lado, la complejidad de los modelos que genera para lograr estos resultados no es demasiado elevada por lo cual MCGEP sobresale junto al algoritmo GASSIST como los más balanceados si se tienen en cuenta ambas métricas al mismo tiempo. Como valor añadido se aprovecha la capacidad de selección de atributos implícita que tiene este tipo de técnicas para sacar algunas conclusiones sobre cuáles son los indicadores de medición que más influyen en la evaluación de un proyecto y cuál o cuáles indicadores permiten detectar a tiempo que un proyecto no logrará una buena evaluación al finalizar.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[In the present work is assessed the behavior of the evolutionary algorithm MCGEP in different versions of a project management database which contains information for projects evaluation. The main idea of this work is to confirm the possibility of applying an evolutionary algorithm that uses genetic expression programming in front of seven other widely used algorithms in the state of the art. The algorithms used in the assess are able to generate interpretable classification models, using evolutionary techniques to obtain them. The experiments were carried out in five versions created from the database with information of the projects evaluation. The MCGEP algorithm achieves the first among the algorithms compared for the predictive accuracy metric; also, it significantly improves the majority of these algorithms for this metric. On the other hand, the complexity of the generated models was acceptable to achieve these results, so MCGEP and GASSIST algorithms excel as the most balanced if both metrics are taken into account at the same time. As value added, we take advantage of the implicit process of feature selection capability that have these kinds of techniques. With this, we draw some conclusions about which are the measurement indicators that most influence the evaluation of a project and which indicators can detect in time which project will not achieve a good evaluation when finalized.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Algoritmos genéticos]]></kwd>
<kwd lng="es"><![CDATA[Programación de Expresiones Genéticas]]></kwd>
<kwd lng="es"><![CDATA[Algoritmo MCGEP]]></kwd>
<kwd lng="es"><![CDATA[Evaluación de Proyectos]]></kwd>
<kwd lng="es"><![CDATA[Aprendizaje de reglas]]></kwd>
<kwd lng="en"><![CDATA[Genetic Algorithms]]></kwd>
<kwd lng="en"><![CDATA[Gene Expression Programming]]></kwd>
<kwd lng="en"><![CDATA[Algorithm MCGEP]]></kwd>
<kwd lng="en"><![CDATA[Project Evaluation]]></kwd>
<kwd lng="en"><![CDATA[Rules´ learning]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font size="4"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Evaluaci&oacute;n  de proyectos usando sistemas basados en algoritmos gen&eacute;ticos de aprendizaje de  reglas</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Evaluation  of Projects by using Genetic Rules Based Systems</font></strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Alain Guerrero Enamorado<strong><sup>1*</sup></strong>, Iliana P&eacute;rez Pupo<strong><sup>1</sup></strong>, Sebasti&aacute;n Ventura</font></strong><font face="Verdana, Arial, Helvetica, sans-serif"><strong><sup>2</sup>, Carlos Morell<sup>3</sup>, Pedro Yobanis Pi&ntilde;ero P&eacute;rez<strong><sup>1</sup></strong></strong></font></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1 </sup>Universidad de las Ciencias Inform&aacute;ticas (UCI). <a href="mailto:alaing@uci.cu">alaing@uci.cu</a>, <a href="mailto:iperez@uci.cu">iperez@uci.cu</a>, <a href="mailto:ppp@uci.cu">ppp@uci.cu</a>, La Habana, Cuba.</font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">    <br>   <sup>2 </sup>Universidad de C&oacute;rdoba (UCO). <a href="mailto:sventura@uco.es">sventura@uco.es</a>, C&oacute;rdoba, Espa&ntilde;a.    ]]></body>
<body><![CDATA[<br>     <sup>3 </sup>Universidad Central &ldquo;Marta Abreu&rdquo; de las Villas (UCLV). <a href="mailto:morell@uclv.cu">morell@uclv.cu</a>, Santa Clara, Cuba.    <br> </font></p>     <P><font face="Verdana, Arial, Helvetica, sans-serif"><span class="class"><font size="2">*Autor para la correspondencia: </font></span><font size="2"><a href="mailto:alaing@uci.cu">alaing@uci.cu</a></font></font>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el presente trabajo se eval&uacute;a el comportamiento del algoritmo  evolutivo MCGEP en diferentes versiones de una base de datos con informaci&oacute;n  sobre la evaluaci&oacute;n de proyectos inform&aacute;ticos. La idea fundamental del trabajo es  evaluar la posibilidad de aplicaci&oacute;n de un algoritmo evolutivo que utiliza  programaci&oacute;n de expresiones gen&eacute;ticas frente a otros siete algoritmos muy  utilizados del estado del arte. Los algoritmos utilizados en la evaluaci&oacute;n son  capaces de generar modelos de clasificaci&oacute;n interpretables utilizando t&eacute;cnicas  evolutivas para obtenerlos. Los experimentos se realizaron en cinco versiones  creadas a partir de un repositorio de datos con informaci&oacute;n sobre la evaluaci&oacute;n  de proyectos. Se logr&oacute; mostrar como el algoritmo MCGEP queda en primer lugar  entre los algoritmos comparados para la m&eacute;trica de exactitud predictiva, adem&aacute;s  mejora significativamente a la mayor&iacute;a de estos algoritmos en esta m&eacute;trica. Por  otro lado, la complejidad de los modelos que genera para lograr estos  resultados no es demasiado elevada por lo cual MCGEP sobresale junto al  algoritmo GASSIST como los m&aacute;s balanceados si se tienen en cuenta ambas  m&eacute;tricas al mismo tiempo. Como valor a&ntilde;adido se aprovecha la capacidad de  selecci&oacute;n de atributos impl&iacute;cita que tiene este tipo de t&eacute;cnicas para sacar  algunas conclusiones sobre cu&aacute;les son los indicadores de medici&oacute;n que m&aacute;s influyen  en la evaluaci&oacute;n de un proyecto y cu&aacute;l o cu&aacute;les indicadores permiten detectar a  tiempo que un proyecto no lograr&aacute; una buena evaluaci&oacute;n al finalizar. </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Palabras clave:</span></b></font> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Algoritmos gen&eacute;ticos, Programaci&oacute;n de Expresiones Gen&eacute;ticas, Algoritmo MCGEP,  Evaluaci&oacute;n de Proyectos, Aprendizaje de reglas.</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">In the present work is assessed the behavior of the evolutionary  algorithm MCGEP in different versions of a project management database which  contains information for projects evaluation. The main idea of this work is to  confirm the possibility of applying an evolutionary algorithm that uses genetic  expression programming in front of seven other widely used algorithms in the  state of the art. The algorithms used in the assess are able to generate interpretable  classification models, using evolutionary techniques to obtain them. The experiments were carried out in five versions  created from the database with information of the projects evaluation. The MCGEP algorithm achieves the first among the  algorithms compared for the predictive accuracy metric; also, it significantly  improves the majority of these algorithms for this metric. On the other hand,  the complexity of the generated models was acceptable to achieve these results,  so MCGEP and GASSIST algorithms excel as the most balanced if both metrics are  taken into account at the same time. As value added, we take advantage of the  implicit process of feature selection capability that have these kinds of  techniques. With this, we draw some conclusions about which are the measurement  indicators that most influence the evaluation of a project and which indicators  can detect in time which project will not achieve a good evaluation when  finalized.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>Key words: </span></b>Genetic Algorithms, Gene Expression Programming, Algorithm MCGEP, Project  Evaluation, Rules&acute; learning.</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El proceso de gesti&oacute;n de proyectos es de suma importancia para las  organizaciones basadas en proyectos, en los &uacute;ltimos a&ntilde;os se han realizado  esfuerzos en la identificaci&oacute;n de riesgos (Cordero-Morales y otros, 2013), la  planificaci&oacute;n de proyectos (Garc&iacute;a-Vacacela y otros, 2016) y en la  planificaci&oacute;n y control (Mar&iacute;n-S&aacute;nchez y otros, 2014). En particular, el proceso  de evaluaci&oacute;n de proyectos resulta de vital importancia para la toma de  decisiones en estas organizaciones. En el caso particular de los proyectos de  tecnolog&iacute;as de la informaci&oacute;n, la media hist&oacute;rica de proyectos satisfactorios  es 30,7 % mientras que los proyectos renegociados son el 47,3 % y los  cancelados el 22 % (The Standish Group International,  2014). Estas cifras implican que enormes presupuestos son afectados cada  a&ntilde;o por concepto de errores en la planificaci&oacute;n o el control y seguimiento de  los proyectos, con un impacto econ&oacute;mico y social. Evaluar los proyectos en cada  corte de forma r&aacute;pida y eficaz, ayuda a mitigar estas p&eacute;rdidas y a detectar de  forma temprana los factores que afectan la ejecuci&oacute;n de los mismos. El proceso  de evaluaci&oacute;n puede ser considerado un problema de clasificaci&oacute;n, donde los  proyectos son clasificados en alguna de las siguientes categor&iacute;as &ldquo;Bien&rdquo;,  &ldquo;Regular&rdquo; y &ldquo;Mal&rdquo;. En este trabajo los autores presentan una alternativa de  soluci&oacute;n para este problema, a partir de proponer algoritmos que aprenden  reglas para la clasificaci&oacute;n de proyectos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Por otra parte, en las organizaciones orientadas a proyectos, generalmente  se gestionan m&uacute;ltiples proyectos simult&aacute;neamente, y se registra en sistemas de  gesti&oacute;n de proyectos un gran volumen de informaci&oacute;n (Castro Aguilar y otros, 2016). De esta forma, cada vez se abre m&aacute;s  la brecha entre la generaci&oacute;n de los datos y la capacidad de los expertos para  comprenderlos o extraer conocimiento &uacute;til de los mismos Witten y otros (2011). En este contexto, es preciso desarrollar  t&eacute;cnicas que permitan analizar los datos e identificar que indicadores son m&aacute;s  relevantes y cu&aacute;les son los factores o causas que mayor incidencia tienen en el  &eacute;xito o fracaso de los proyectos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para resolver esta problem&aacute;tica, diferentes autores han propuesto diversos  algoritmos entre los que se destacan:&nbsp; las  M&aacute;quinas de Soporte Vectorial (SVM) (Vapnik,  1995), las Redes Neuronales Artificiales (ANNs) (McClelland, y otros, 1986) y el Bayesiano Ingenuo (NB) (Domingos, y otros, 1997). Sin embargo, todos  ellos tienen el problema de que generan modelos con buen nivel de exactitud  pero que son poco interpretables. Otros enfoques, potencian la clasificaci&oacute;n  pero manteniendo altos niveles de interpretabilidad, algunos de ellos son UCS (Bernad&oacute;-Mansilla, 2003), GASSIST (Bacardit, 2004), SLAVE (Gonz&aacute;lez, 1999), LOGIT-BOOST (Otero,  2006), CORE (Tan, 2006), Tan ( 2002), Bojarczuk (2004). Por otro lado, en Cano y  otros (2013) se expone que este tipo de algoritmos interpretables pueden  ser aprovechados para hacer selecci&oacute;n de atributos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La principal contribuci&oacute;n del presente trabajo radica en validar la  posibilidad de aplicar un algoritmo evolutivo de clasificaci&oacute;n utilizando  programaci&oacute;n de expresiones gen&eacute;ticas (MCGEP) introducido en Guerrero-Enamorado y otros (2016) para la evaluaci&oacute;n  de proyectos. Como valor a&ntilde;adido se pretende tambi&eacute;n aprovechar la capacidad de  selecci&oacute;n de atributos impl&iacute;cita que tienen este tipo de algoritmos para  conocer cu&aacute;les son los indicadores de medici&oacute;n que m&aacute;s influyen en la  evaluaci&oacute;n de un proyecto.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El trabajo se encuentra  dividido en tres sesiones fundamentales. La siguiente sesi&oacute;n &ldquo;Materiales y  m&eacute;todos&rdquo; describe el algoritmo MCGEP propuesto en la investigaci&oacute;n. Luego se  presentan los resultados de experimentaci&oacute;n y su an&aacute;lisis y finalmente se  presentan las conclusiones del trabajo. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En esta secci&oacute;n se explica el principio de funcionamiento del algoritmo MCGEP,  as&iacute; como algunos de sus elementos de dise&ntilde;o fundamentales. Para mayor  profundidad puede revisarse el trabajo donde se introdujo el mismo (Guerrero-Enamorado y otros, 2016). En MCGEP se utilizan  dos fases, en la primera se sigue el esquema cl&aacute;sico de los algoritmos gen&eacute;ticos  y en la segunda se ordenan las reglas obtenidas para crear el clasificador.</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Fase 1: Descubrimiento de reglas.</font></p>   </li>   <ul>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Generaci&oacute;n de la poblaci&oacute;n  inicial </font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Evaluaci&oacute;n de la poblaci&oacute;n  inicial.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Selecci&oacute;n, Cruzamiento, Mutaci&oacute;n.</font></p>     </li>         <li>           ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Evaluaci&oacute;n de la descendencia.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Reemplazo y competici&oacute;n para  generar un vector-soluci&oacute;n de individuos no redundantes.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se repiten los pasos 3 al 5 hasta  que se cumpla la condici&oacute;n de parada (cantidad de generaciones).</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se guarda el &uacute;ltimo vector-soluci&oacute;n  de individuos no redundantes obtenido.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se repiten los pasos 2 al 7 para  cada clase de la colecci&oacute;n de datos.</font></p>     </li>         <li>           ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se crea una lista con la uni&oacute;n de  los vectores-soluci&oacute;n no redundantes por cada clase.</font></p>     </li>       </ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Fase 2: Ordenamiento de reglas.</font></p>   </li>   <ul>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Crear un clasificador vac&iacute;o.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Ordenar la lista obtenida en la  Fase 1 (paso 9).</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Adicionar al clasificador la  mejor regla y eliminarla de la lista inicial.</font></p>     </li>         ]]></body>
<body><![CDATA[<li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Eliminar de la colecci&oacute;n de datos  las instancias cubiertas por la mejor regla.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Reevaluar y ordenar las reglas en  las instancias que quedaron en la colecci&oacute;n de datos.</font></p>     </li>         <li>           <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Repetir desde el paso 3, hasta  que no queden reglas o instancias en la colecci&oacute;n de datos.</font></p>     </li>         <li>      <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Devolver el clasificador para que  se utilice en la etapa de evaluaci&oacute;n. </font></li>       </ul>     </ul>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Codificaci&oacute;n de los individuos con Programaci&oacute;n de Expresiones  Gen&eacute;ticas (GEP)</font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el dise&ntilde;o del algoritmo MCGEP se utiliz&oacute; la tecnolog&iacute;a de programaci&oacute;n  de expresiones gen&eacute;ticas de Ferreira (2006)  para codificar los individuos. Esta innovadora tecnolog&iacute;a aprovecha la  eficiencia de los Algoritmos Gen&eacute;ticos (GA) para evolucionar y la potencia de  los &aacute;rboles de la Programaci&oacute;n Gen&eacute;tica (GP) para construir reglas en forma de Funciones  Discriminantes (DF). De esta forma, en la &ldquo;Programaci&oacute;n de Expresiones Gen&eacute;ticas&rdquo;,  los individuos son representados genot&iacute;picamente en forma de cadenas de caracteres  y fenot&iacute;picamente en forma de &aacute;rboles de expresi&oacute;n (ET) que al final se  traducen en una funci&oacute;n discriminante. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Como elemento distintivo, la tecnolog&iacute;a GEP separa el genotipo en dos  partes: la &ldquo;cabeza&rdquo; y la &ldquo;cola&rdquo;. La cabeza puede generarse con funciones,  atributos predictores o constantes, su tama&ntilde;o es uno de los par&aacute;metros del  algoritmo. Una vez definida la cabeza, el tama&ntilde;o de la cola queda determinado  puesto que est&aacute; dise&ntilde;ada para garantizar que existan suficientes elementos  terminales en caso de que la cabeza est&eacute; compuesta solo de funciones. Esto  garantiza la completitud de los ET y es una de las ventajas que tiene, pues en  GP se necesita verificar a nivel micro del proceso evolutivo la validez de los  &aacute;rboles que se van generando. En los casos donde la cabeza no tenga solo  funciones, la informaci&oacute;n presente en el genotipo (cabeza + cola) no se expresa  del todo a nivel fenot&iacute;pico al igual que en los seres vivos donde existe  informaci&oacute;n gen&eacute;tica que no se expresa fenot&iacute;picamente, pero que permanece  latente hasta que un cruzamiento o una mutaci&oacute;n permite su activaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La generaci&oacute;n de la poblaci&oacute;n inicial se realiza de manera muy simple,  puesto que solo es necesario garantizar que la cabeza se genere aleatoriamente  con funciones, atributos predictores o constantes mientras que la cola solo con  constantes y atributos predictores. Otro elemento importante del MCGEP es que  solo utiliza las funciones aritm&eacute;ticas b&aacute;sicas (suma, resta, multiplicaci&oacute;n y  divisi&oacute;n) para codificar los individuos, los elementos terminales pueden ser  cualquiera de los atributos predictores o una constante escogida aleatoriamente  de una lista que se provee como par&aacute;metro. Cada individuo codifica una DF,  adem&aacute;s se asigna como consecuente la clase que &eacute;l predice. Para guiar el  proceso evolutivo se utilizaron los siguientes operadores gen&eacute;ticos:</font></p> <ul>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Mutador simple (<em>GEPSimpleMutt</em>), puede ocurrir con una  probabilidad definida como par&aacute;metro en cualquier lugar del genotipo, solo debe  garantizarse que en la cola los atributos y constantes sean modificados por atributos  y constantes, en la cabeza todo tipo de cambio es permitido entre los  atributos, las constantes y las funciones.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Mutador de transposici&oacute;n con inserci&oacute;n  de secuencia (<em>GEPISTranspMutt</em>), la  probabilidad de ocurrencia tambi&eacute;n se define como par&aacute;metro. Se selecciona  entonces aleatoriamente una secuencia de elementos a transponer, esta secuencia  es insertada en una posici&oacute;n aleatoria de la cabeza exceptuando el inicio para  evitar que se formen individuos de un solo elemento (Ferreira, 2006).</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Mutador de transposici&oacute;n con  inserci&oacute;n de secuencia en la ra&iacute;z (<em>GEPISTranspMutt</em>),  a grueso modo este operador selecciona aleatoriamente una secuencia de  elementos a transponer, pero con la restricci&oacute;n de que inicie con una funci&oacute;n.  Esta secuencia es insertada en el inicio de la cabeza del genotipo.</font></p>   </li>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recombinador por un punto (<em>GEPOnePointRecomb</em>), son seleccionados  dos individuos, en ellos se selecciona aleatoriamente un mismo punto de corte,  se intercambian entonces las partes resultantes para generar dos nuevos  individuos. Por ejemplo, los individuos Aa y Bb generan la descendencia Ab y  aB.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recombinador por dos puntos (<em>GEPTwoPointRecomb</em>), similar al anterior,  pero ahora se seleccionan dos puntos de corte en cada uno de los dos  progenitores, estos puntos determinan una secuencia de genes en cada uno de  ellos. Las secuencias de los progenitores son intercambiadas para generar dos  nuevos individuos. Por ejemplo, AaA y BbB generar&iacute;an la descendencia AbA y BaB.  Ferreira (2006) recomienda no utilizar  los operadores de recombinaci&oacute;n (de un punto y de dos puntos) solos puesto que  pueden generar convergencia prematura, pero combinados con los de mutaci&oacute;n  logran una mejor exploraci&oacute;n del espacio caracter&iacute;stico. </font></p>   </li>     </ul>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Descubrimiento de Funciones Discriminantes (DF) para la  clasificaci&oacute;n de informaci&oacute;n</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los individuos del tipo GEP  que involucran a los atributos predictores dentro de una funci&oacute;n discriminante  pueden utilizarse para extraer informaci&oacute;n de los datos como se expone en el  trabajo de Espejo y otros (2009). Este  tipo de funciones pueden ser evaluadas en el conjunto de los atributos  predictores de una base de datos devolviendo un n&uacute;mero real como salida, esta  salida puede ser interpretada utilizando un umbral (normalmente cero) para  definir una salida de clasificaci&oacute;n binaria. Con este tipo de funciones (ver  Ecuaci&oacute;n 1) puede crearse una base de conocimientos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><img src="/img/revistas/rcci/v11n4/fo0104417.jpg" alt="fo01" width="399" height="30"></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En MCGEP, el problema multi-clase se resuelve utilizando un enfoque  uno-contra-todos, donde la soluci&oacute;n del problema de <em>n</em>-clases es transformada en la soluci&oacute;n de <em>n</em> problemas de clasificaci&oacute;n binaria. Por tanto, dada una clase en  cuesti&oacute;n, las instancias que pertenecen a dicha clase son tomadas como  positivas y el resto como negativas en la matriz de confusi&oacute;n binaria de cada  clase. Partiendo de esta matriz de confusi&oacute;n se puede calcular la funci&oacute;n de  aptitud que se detalla pr&oacute;ximamente. Por otro lado, es poco probable que en los  problemas del mundo real se logren encontrar reglas capaces de cubrir todas las  instancias de una clase, por lo cual deben descubrirse varias reglas en cada  clase. En la Fase 2 del algoritmo la base de reglas es ordenada utilizando para  ello la precisi&oacute;n de cada regla conformando as&iacute; el clasificador definitivo en  forma de lista de decisi&oacute;n, al cual adem&aacute;s se le adiciona una clase por defecto  que ser&iacute;a la clase m&aacute;s numerosa de las instancias que no sean cubiertas. La  Ecuaci&oacute;n 2 representa un ejemplo de clasificador seg&uacute;n este esquema.</font></p>     <p><img src="/img/revistas/rcci/v11n4/fo0204417.jpg" alt="fo02" width="454" height="102"></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">Funci&oacute;n de aptitud</font></strong></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para definir la funci&oacute;n de aptitud se parte de la que se propone en Bojarczuk (2004) realizando algunas  modificaciones se obtuvo la siguiente Ecuaci&oacute;n 3.</font></p>     <p><img src="/img/revistas/rcci/v11n4/fo0304417.jpg" alt="fo03" width="536" height="59"></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la ecuaci&oacute;n anterior, tp, tn, fn y fp representan los verdaderos positivos, verdaderos negativos, los falsos  negativos y los falsos positivos respectivamente, extra&iacute;dos de la matriz de  confusi&oacute;n obtenida de evaluar un individuo en la colecci&oacute;n de entrenamiento; w1 y w2 son par&aacute;metros que permiten variar el nivel de importancia que se les da  a los fn y fp &nbsp;respectivamente. A los dos  primeros factores tambi&eacute;n se les conoce como sensibilidad y especificidad. El  tercer factor incluido en la Ecuaci&oacute;n 3, permite tener en cuenta que los individuos  m&aacute;s simples son preferibles pues tienden a tener mayor capacidad de  generalizaci&oacute;n.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Estrategia de reemplazo</strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Se utiliza una estrategia de  reemplazo de truncamiento con elitismo, es decir, un peque&ntilde;o porcentaje de la  poblaci&oacute;n es preservado a toda costa (definido como par&aacute;metro), mientras que se  mantiene una poblaci&oacute;n constante reemplazando los menos aptos de la misma con la  descendencia obtenida durante el proceso de aplicaci&oacute;n de los operadores  gen&eacute;ticos. Por otro lado, como parte de esta estrategia MCGEP es capaz de  generar una lista de individuos no redundantes respecto a las instancias que  cubren de la colecci&oacute;n de entrenamiento, esto se logra utilizando una  competici&oacute;n por las instancias (<em>TokenCompetition</em>)  similar a la utilizada en Olmo (2013).  Dicha competici&oacute;n hace que individuos redundantes tiendan a desaparecer de la  poblaci&oacute;n. Para esto, primero se ordena la poblaci&oacute;n atendiendo a la funci&oacute;n de  aptitud de cada individuo, despu&eacute;s durante la competici&oacute;n, se calcula una nueva  funci&oacute;n de aptitud re-ajustada por la raz&oacute;n entre las instancias no cubiertas y  el total de instancias cubiertas. Los individuos redundantes obtienen un valor  en la funci&oacute;n de aptitud m&aacute;s bajo, pudiendo ser incluso igual a cero cuando  estos no son capaces de cubrir ninguna instancia que no haya sido cubierta por  otros individuos anteriormente. Todo el proceso evolutivo se repite durante un  n&uacute;mero de generaciones definido previamente, evolucionando de esta manera dicho  vector soluci&oacute;n el cual es reincorporado nuevamente a la poblaci&oacute;n (algoritmo elitista).  Al concluir el proceso, se guarda el &uacute;ltimo vector soluci&oacute;n obtenido y se  reinicia el proceso evolutivo tantas veces como clases tenga la colecci&oacute;n de  datos. Finalmente, en la fase 2 la base de reglas obtenida con la uni&oacute;n del  conjunto de vectores no redundantes de cada clase es ordenada y utilizada como  clasificador. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En la evaluaci&oacute;n de la propuesta se emplean t&eacute;cnicas de triangulaci&oacute;n de  datos espacial y se prueban diferentes algoritmos con cinco bases de datos  asociadas a la evaluaci&oacute;n de proyectos del &ldquo;Repositorio para Investigaciones de  Gesti&oacute;n de Proyectos&rdquo; (Pi&ntilde;ero P&eacute;rez y otros,  2016) que provee el &ldquo;Laboratorio de Investigaciones en Gesti&oacute;n de  Proyectos&rdquo; de la &ldquo;Universidad de las Ciencias Inform&aacute;ticas&rdquo;. En particular, estas  bases de datos recogen informaci&oacute;n de 8430 cortes de 667 proyectos entre  septiembre del 2012 y febrero del 2013 considerando 84 atributos predictores y  tres clases como atributo decisi&oacute;n (Bien, Regular, Mal).&nbsp; Las bases de datos se describen en la <a href="/img/revistas/rcci/v11n4/t0104417.jpg" target="_blank">Tabla 1</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para la  validaci&oacute;n del algoritmo MCGEP se comparan los resultados contra siete algoritmos  similares descritos en (Bernad&oacute;-Mansilla, 2008):</font></p> <ul>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">UCS (Bernad&oacute;-Mansilla, 2003): es un algoritmo gen&eacute;tico basado en  reglas, utiliza un enfoque Michigan. Es una mejora derivada del conocido  algoritmo XCS, pero funciona utilizando aprendizaje supervisado. &nbsp;Evoluciona los mapas de acci&oacute;n que introduce  XCS de manera m&aacute;s eficiente.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GASSIST (Bacardit, 2004): algoritmo basado en GABIL. Se reporta en la  bibliograf&iacute;a como uno de los algoritmos estilo Pittsburg m&aacute;s competitivos. Es  un algoritmo gen&eacute;tico que evoluciona individuos en forma de conjuntos de reglas  ordenadas de longitud variable.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">SLAVE (Gonz&aacute;lez, 1999): algoritmo gen&eacute;tico basado en reglas borrosas que  utiliza el enfoque de aprendizaje iterativo con el objetivo de reducir el  espacio de b&uacute;squeda.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">LOGIT-BOOST (Otero, 2006): algoritmo similar al AdaBoost que  utiliza una &ldquo;versi&oacute;n codiciosa del ajuste posterior&rdquo; (<em>greedy version of generalized backfitting</em>) para construir un modelo  aditivo. El algoritmo LOGIT-BOOST es una extensi&oacute;n del anterior que permite inducir  clasificadores borrosos.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CORE (Tan, 2006): algoritmo co-evolutivo para el descubrimiento de  reglas, cada individuo codifica una regla y un conjunto completo de reglas es  evolucionado simult&aacute;neamente. Las reglas cooperan unas con otras para producir  un conjunto &oacute;ptimo de reglas y al mismo tiempo el conjunto es reducido por  medio de una competencia por las instancias similar a la utilizada en MCGEP.</font></p>   </li>       <li>         ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Tan (2002): algoritmo de programaci&oacute;n gen&eacute;tica que evoluciona reglas de  clasificaci&oacute;n del tipo <em>IF-THEN</em>, utilizando  un enfoque Michigan, como se dijo anteriormente utiliza una competencia por las  instancias para reducir redundancia. De este trabajo se utilizaron algunas  ideas para implementar el MCGEP.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Bojarczuk (2004): utiliza un enfoque hibrido entre Michigan y Pittsburgh, un  individuo contiene m&uacute;ltiples reglas de clasificaci&oacute;n, pero todas con el mismo  consecuente. Utiliza una disyunci&oacute;n de los antecedentes de las reglas, donde  cada antecedente es entonces una forma conjuntiva de condiciones l&oacute;gicas de la  forma atributo-valor.</font></p>   </li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para los  algoritmos MCGEP, Tan y Bojarczuk se utilizaron las implementaciones del JCLEC  (<a href="http://jclec.sourceforge.net/">http://jclec.sourceforge.net/</a>). Este marco  de trabajo se describe en (Ventura, y otros, 2008),  es un software de c&oacute;digo abierto que permite implementar algoritmos evolutivos  desarrollado sobre tecnolog&iacute;a Java. En la <a href="#t02">Tabla 2</a>  se  muestran las configuraciones utilizadas para el algoritmo MCGEP con vistas a  garantizar la posibilidad de replicaci&oacute;n de los experimentos.</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n4/t0204417.jpg" alt="t02" width="544" height="230"><a name="t02"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el resto de los algoritmos se utilizaron las implementaciones del KEEL  (<a href="http://www.keel.es/">http://www.keel.es/</a>), este &uacute;ltimo  es tambi&eacute;n una aplicaci&oacute;n de c&oacute;digo abierto en tecnolog&iacute;a Java que permite realizar  evaluaciones de t&eacute;cnicas de Aprendizaje Evolutivo y <em>Soft Computing</em> (Alcal&aacute;-Fdez y otros,  2011).</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las configuraciones utilizadas para UCS, GASSIST, HIDER, SLAVE, LOGIT-BOOST  y CORE fueron las recomendadas por sus autores y se encuentran condensadas en  el trabajo de (Orriols-Puig y otros, 2008).  En los casos de los algoritmos de Tan (2002)  y Bojarczuk (2004) se utilizaron las  configuraciones que sus autores recomiendan. Los experimentos se realizaron en  una estaci&oacute;n de trabajo con un Intel(R) Core(TM) i7-4790 CPU @ 3.60GHz, 8GiB  Memoria DDR3 y un sistema operativo Gnu/Linux con un n&uacute;cleo 4.4.0-66-generic-Ubuntu-SMP.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para evaluar el desempe&ntilde;o de  los algoritmos se utilizaron las m&eacute;tricas: Exactitud predictiva (Acc) y el  N&uacute;mero de reglas de los modelos obtenidos (NR). Estas m&eacute;tricas se promedian utilizando  la t&eacute;cnica de validaci&oacute;n cruzada con 10 particiones cada una con cinco semillas  aleatorias. Estos resultados se muestran en la <a href="/img/revistas/rcci/v11n4/t0304417.jpg" target="_blank">Tabla 3</a>  y la <a href="/img/revistas/rcci/v11n4/t0404417.jpg" target="_blank">Tabla 4</a>  respectivamente. Cada fila  representa los resultados para una colecci&oacute;n de las cinco utilizadas. La &uacute;ltima  fila representa el ranking promedio del algoritmo en todas las colecciones. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Entre los algoritmos estudiados el MCGEP logra aproximar bases de reglas  con una mayor exactitud predictiva en todos los casos. El algoritmo Gassist,  cuya robustez ha sido mostrada en varios trabajos (Bernad&oacute;-Mansilla, 2008; Bacardit, 2004; Guerrero-Enamorado, y otros,  2016) queda en segundo lugar en esta m&eacute;trica. Las implementaciones de  los algoritmos CORE y LogitBoost utilizadas en esta experimentaci&oacute;n colapsan y predicen  siempre la evaluaci&oacute;n de Mal para todos los casos, por eso el bajo valor de  exactitud que devuelven.</font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En el caso del algoritmo CORE logra quedar en primer lugar a expensas de  un gran deterioro en la exactitud predictiva, puesto que tiende a generar solo  una regla que siempre da la misma respuesta de clasificaci&oacute;n.</font></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">An&aacute;lisis estad&iacute;stico de los  resultados</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para realizar el an&aacute;lisis estad&iacute;stico de los resultados se siguieron las  recomendaciones de Derrac y otros (2011).  Por lo cual se aplicaron varios test no-param&eacute;tricos. En todos los casos  primero se verific&oacute; el cumplimiento o no de la hip&oacute;tesis nula por medio del  test de Friedman y en los casos donde fue rechazada se aplicaron entonces pruebas <em>posthoc</em>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el caso de la exactitud predictiva la hip&oacute;tesis nula fue rechazada por  el test de Friedman con un p-valor de 0.000025 por lo cual se aplicaron las  pruebas de Holm, Finner y Li (Derrac, y otros,  2011). Los resultados de estas pruebas se muestran en la <a href="/img/revistas/rcci/v11n4/t0504417.jpg" target="_blank">Tabla 5</a> , dicha  tabla muestra que todas las pruebas estad&iacute;sticas concuerdan en que el algoritmo  MCGEP tomado como control, mejora significativamente a los algoritmos CORE,  LogitBoost, UCS y Tan. Los test de Finner y Li que tienen un mayor poder  discriminante tambi&eacute;n encuentran que MCGEP mejora a Bojarczuk. Finalmente,  ninguno de los test utilizados logra encontrar diferencia significativa de  MCGEP frente a los algoritmos SLAVE y Gassist.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para el caso del tama&ntilde;o de los modelos obtenidos la hip&oacute;tesis nula fue  rechazada por el test de Friedman con un p-valor de 0.000011 por lo cual tambi&eacute;n  se aplicaron las pruebas de Holm, Finner y Li. Los resultados de estas pruebas  se muestran en la <a href="#t06">Tabla 6</a>, en ella se observa que todas las pruebas  estad&iacute;sticas concuerdan en que CORE, tomado como algoritmo de control, mejora  significativamente a los algoritmos UCS, LogitBoost, SLAVE y Tan. Finalmente,  ninguno de los test utilizados logra encontrar diferencia significativa de CORE  frente a los algoritmos MCGEP, Gassist, Bojarczuk respecto al tama&ntilde;o de los  modelos obtenidos.</font></p>     <p align="center"><img src="/img/revistas/rcci/v11n4/t0604417.jpg" alt="t06" width="415" height="178"><a name="t06"></a></p>     <p><font size="2"><strong><font face="Verdana, Arial, Helvetica, sans-serif">An&aacute;lisis del poder discriminante de  los atributos</font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para poder realizar este an&aacute;lisis se tomaron las bases de reglas obtenidas  en cada uno de los 50 experimentos (validaci&oacute;n cruzada en 10 partes y 5  semillas aleatorias en cada una) realizados en cada base de datos, con estos se  construyeron los histogramas de los atributos que aparecen en cada base de  reglas, por razones de espacio no se muestra en este trabajo el histograma  completo de los atributos obtenido para cada base de datos, en su lugar se  muestra en la </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a href="/img/revistas/rcci/v11n4/t0704417.jpg" target="_blank">Tabla 7</a>  un resumen del <em>ranking</em> de los atributos m&aacute;s interesantes para analizar en cada base de datos. Enti&eacute;ndase  como atributos m&aacute;s interesantes a los primeros 10 en los <em>rankings </em>de cada base de datos y algunos m&aacute;s que permitieron  arribar a conclusiones. La primera columna de esta tabla no es m&aacute;s que el <em>ranking</em> de dicho atributo aplicando el  m&eacute;todo de la Ganancia de Informaci&oacute;n (GI) en la base de datos PE0. La segunda  columna es el nombre del atributo tal cual aparece en cada base de datos.  Despu&eacute;s viene el <em>ranking</em> de dicho  atributo en la base de reglas (RB) obtenida para cada base de datos, finalmente  se calculan los promedios (Prom.) y la desviaci&oacute;n est&aacute;ndar (Desv. Std.) de  estos valores. El promedio brinda una idea del poder discriminante de dicho  atributo en todas las versiones de la base de datos y la desviaci&oacute;n est&aacute;ndar de  la consistencia del valor anterior. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Analizando los resultados de la  <a href="/img/revistas/rcci/v11n4/t0704417.jpg" target="_blank">Tabla 7</a>, se puede llegar a la conclusi&oacute;n de que los siguientes atributos son  imprescindibles para predecir la evaluaci&oacute;n final de un proyecto:</font></p> <ul>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>ie</em>, &iacute;ndice de ejecuci&oacute;n, representa el  avance real de un proyecto.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>ire</em>, &iacute;ndice de rendimiento de la ejecuci&oacute;n,  muestra el estado de avance o progreso del proyecto respecto a sus hitos de  ejecuci&oacute;n considerando todos los hitos. </font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>real_ire</em>, impacto de los hitos de ejecuci&oacute;n  cerrados hasta la fecha de corte en el proyecto.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>impacto_total_hitos_ejec</em>, impacto  total esperado por los hitos de ejecuci&oacute;n del proyecto.</font></p>   </li>       <li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>plan_ire</em>, plan de la ejecuci&oacute;n esperada de los  hitos de ejecuci&oacute;n hasta la fecha de corte.</font></p>   </li>       ]]></body>
<body><![CDATA[<li>         <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><em>irhf</em>, &iacute;ndice de rendimiento del recurso  humano con respecto a la eficiencia, muestra el estado de avance o progreso del  recurso humano en la realizaci&oacute;n de las tareas que tiene asignadas. </font></p>   </li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Una de las funciones  discriminantes que se obtuvo con mucha fuerza muestra que &ldquo;si el ire &lt; 0.5  entonces es muy probable que el proyecto sea evaluado al final de Mal&rdquo;. Esto  independientemente del tiempo, del proyecto que sea, de los recursos humanos  asignados y de todos los dem&aacute;s atributos. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Un atributo que se analiz&oacute; fue el identificador de proyecto <em>project_id</em>, dicho atributo solo estuvo  presente en las versiones de las bases de datos PE0 y PE1, sin embargo, en  ellas no logr&oacute; aparecer como un atributo imprescindible para lograr clasificar  correctamente la evaluaci&oacute;n de los proyectos. No obstante, desde el punto de  vista de la Ganancia de Informaci&oacute;n se evidencia que existe correlaci&oacute;n entre  dicho atributo y la salida de clasificaci&oacute;n (evaluaci&oacute;n) de un proyecto  motivado porque la base de datos es de &ldquo;cortes de un proyecto&rdquo; y en los  proyectos evaluados de &ldquo;<em>Bien&rdquo;</em> este  atributo coincide en diversos registros al igual que en los evaluados de &ldquo;<em>Mal&rdquo;.</em> Algo interesante tambi&eacute;n ocurre  con el atributo <em>iref </em>(&iacute;ndice de  rendimiento de la eficacia), pues el mismo como puede observarse en la fila con  valor 7 de GI de la <a href="/img/revistas/rcci/v11n4/t0704417.jpg" target="_blank">Tabla 7</a> evidencia que existe una relaci&oacute;n entre este y los  atributos <em>project_id </em>y<em> fecha</em>.Para llegar a esta conclusi&oacute;n se puede notar como el <em>iref</em> es muy importante cuando est&aacute;n  presentes <em>project_id </em>y<em> fecha </em>al mismo tiempo en las bases de  datos (PE0 y PE1), tambi&eacute;n es muy importante cuando no est&aacute;n ambos atributos  presentes al mismo tiempo (PE4). Sin embargo, cuando no est&aacute; presente el  atributo <em>project_id</em> y si lo est&aacute; el  atributo <em>fecha</em> el atributo <em>iref </em>pasa a ser un atributo poco  relevante. Esto ocurre porque este atributo habla de la calidad del proyecto, y  se tiene informaci&oacute;n relevante de este atributo solo en etapas avanzadas del  proyecto. Finalmente se puede notar como se vuelve a evidenciar la relaci&oacute;n  entre los atributos <em>project_id </em>y<em> fecha</em> en la fila con valor 34 de GI de  la Tabla 7, puesto que a partir de la base de datos PE2 desde la cual se  elimin&oacute; el atributo <em>project_id</em> la  relevancia del atributo <em>fecha</em> decae  bastante. Esto ocurre porque el atributo <em>iref</em> representa la calidad del proyecto y esta tiene valores concretos en etapas  avanzadas del proyecto de all&iacute; su dependencia con la fecha.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las filas con  valores de GI 38, 39, 49, 51, 53 y 58 de la Tabla 7 evidencian que los  atributos relativos a las cantidades de: reci&eacute;n graduados en adiestramiento, otros  trabajadores, estudiantes de 4to a&ntilde;o, estudiantes de 5to a&ntilde;o, especialistas y  estudiantes de 3er a&ntilde;o influyen muy poco en la evaluaci&oacute;n de los proyectos  estudiados, esto puede deberse a una de dos causas posibles; la primera es que  en todos los proyectos estudiados se asignaron las cantidades requeridas de  estos trabajadores del proyecto, la segunda es que estas cantidades no influyen  en la evaluaci&oacute;n de un proyecto y cuando lo hacen se determin&oacute; que es m&aacute;s  probable que lo hagan para predecir las evaluaciones de Mal o Regular. Cabe  destacar que en todos los casos al menos existi&oacute; como promedio un trabajador de  cada una de las categor&iacute;as anteriores entre todas las instancias de la  colecci&oacute;n, por tanto, para poder determinar la causa debe profundizarse a&uacute;n m&aacute;s  el estudio.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En contraposici&oacute;n a lo anterior observando la fila con valor de GI 35 el  atributo de <em>cant_esp_comp</em> si fue  determinante en la mayor&iacute;a de las bases de datos (PE0, PE1 y PE2) no as&iacute; cuando  se eliminaron las filas nulas de la base de datos (PE3 y PE4). En todos los  casos como promedio se dispon&iacute;a de 5 &ldquo;especialistas con competencias elevadas&rdquo;  en los proyectos, y todo apunta a que cuando la cantidad de &ldquo;especialistas con  competencias elevadas&rdquo; en el proyecto fue de 0 dicho atributo logr&oacute; un mayor  poder discriminante. Al mismo tiempo se evidencia que este influye bastante en  la evaluaci&oacute;n del proyecto, sobre todo cuando fue cercano a cero, adem&aacute;s esto  se pudo constatar revisando que dicho atributo aparece m&aacute;s en las reglas que  predicen la evaluaci&oacute;n de Mal y Regular en los proyectos. Por tanto, parece ser  que la cantidad de &ldquo;especialistas con competencias elevadas&rdquo; solo es  discriminante cuando estos no est&aacute;n presentes en los proyectos pues esto trae  consigo una mala evaluaci&oacute;n de los proyectos, sin embargo, cuando estos est&aacute;n  presentes no determinan la evaluaci&oacute;n de Bien, pues esta es determinada m&aacute;s por  los atributos analizados con anterioridad. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Otras relaciones pueden  estudiarse a partir de los resultados obtenidos, pero el presente trabajo solo  se concentr&oacute; en las m&aacute;s significativas para la toma de decisiones. Finalmente,  en todas las bases de datos se encontraron reglas con un poder predictivo por  encima del 90% para las evaluaciones de Mal y Bien, en cambio para la clase de Regular  el poder predictivo de las reglas no fue bueno pues estuvo entre el 40% y el  50% de efectividad. </font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con el presente trabajo se valid&oacute; la aplicaci&oacute;n del algoritmo evolutivo de  clasificaci&oacute;n con programaci&oacute;n de expresiones gen&eacute;ticas: MCGEP para predecir la  evaluaci&oacute;n de bases de datos de gesti&oacute;n de proyectos. Dicho algoritmo genera una  base de reglas para la clasificaci&oacute;n, descubre las reglas con mayor nivel de  sensibilidad, especificidad y menor nivel de complejidad en el dominio de  aplicaci&oacute;n. Se compararon los resultados del algoritmo MCGEP frente a otros  siete algoritmos reportados en la literatura para generar reglas de clasificaci&oacute;n. </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con respecto a la variable &ldquo;exactitud predictiva&rdquo; el MCGEP obtuvo mejores  resultados en las cinco bases de datos analizadas, aunque sin diferencias  significativas con los algoritmos SLAVE y Gassist; la robustez del algoritmo Gassist,  ha sido mostrada en varios trabajos de revistas indexadas en la <em>Web</em> de la Ciencia. En cambio, MCGEP si fue  significativamente mejor que los algoritmos CORE, LogitBoost, UCS, Tan y Bojarczuk.  En cuanto a la variable &ldquo;complejidad de los modelos de predicci&oacute;n&rdquo; se encontr&oacute;  que el algoritmo CORE es el que obtiene los sistemas de reglas m&aacute;s simples,  aunque no se encontraron diferencias significativas con MCGEP, Gassist y Bojarczuk.  Tomando en consideraci&oacute;n las variables &ldquo;complejidad de los modelos de  predicci&oacute;n&rdquo; y &ldquo;exactitud predictiva&rdquo; simult&aacute;neamente los algoritmos con mejores  resultados fueron MCGEP y Gassist.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Por otro lado, al analizar las bases de reglas obtenidas, se logr&oacute;  determinar que, de los 84 atributos descriptores, los atributos <em>ire</em>, <em>ie</em>, <em>real_ire</em>, <em>impacto_total_hitos_ejec</em>, <em>plan_ire</em> e <em>irhf,</em> son los que en conjunto m&aacute;s  aportan, para predecir una evaluaci&oacute;n de un proyecto en cualquiera de las  categor&iacute;as Bien, Regular o Mal. Se encontr&oacute; que si el atributo <em>ire</em> es menor que 0.5 permite predecir  con bastante exactitud (de m&aacute;s de un 90%) que el proyecto ser&aacute; evaluado de Mal.  Se evidenci&oacute; tambi&eacute;n que existe una fuerte relaci&oacute;n entre los atributos <em>project_id</em> y <em>fecha</em>, este efecto se produce porque el <em>id</em> del proyecto impl&iacute;citamente implica un orden cronol&oacute;gico de  creaci&oacute;n de este.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las bases de reglas obtenidas mostraron que la presencia de &ldquo;especialistas  con competencias elevadas&rdquo; influye directamente en la evaluaci&oacute;n de los  proyectos sobre todo cuando esta es cercana a cero pues en ese caso permite definir  que un proyecto ser&aacute; evaluado de Mal con una alta probabilidad; el empleo de  especialistas con menos competencias tiene menor influencia en la evaluaci&oacute;n de  los proyectos.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">En las pruebas de sensibilidad  respecto a los atributos el algoritmo MCGEP mostr&oacute; robustez y mantuvo resultados  estables en la evaluaci&oacute;n de los proyectos. Finalmente, como trabajo futuro se  recomienda continuar avanzando en el an&aacute;lisis de datos para la toma de  decisiones de gesti&oacute;n de proyectos, por el impacto econ&oacute;mico y social de esta  &aacute;rea de la actividad humana. Tambi&eacute;n se recomienda, analizar el impacto de la  cantidad de recursos humanos y no humanos, as&iacute; como las competencias de los  recursos humanos en la evaluaci&oacute;n de los proyectos. En la base de datos  empleada se debe profundizar en el an&aacute;lisis de los casos evaluados de Regular  pues en ellos los resultados de los algoritmos no fueron buenos. </font></p>     <p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font>      <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ALCAL&Aacute;-FDEZ JES&Uacute;S [y otros] KEEL Data-Mining Software Tool: Data Set   Repository, Integration of Algorithms and Experimental Analysis Framework   [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Multiple-Valued Logic and Soft   Computing.&nbsp;- 2011.&nbsp;- 2-3.&nbsp;- p&aacute;gs. 255-287.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BACARDIT JAUME Pittsburgh genetic-based machine learning   in the data mining era: representations and generalization and run-time   [Informe].&nbsp;- Barcelona&nbsp;: Department of Computer Science, University   Ramon LLull, 2004.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BERNAD&Oacute;-MANSILLA ALBERT   ORRIOLS-PUIG AND JORGE CASILLAS AND ESTER Genetic-based machine learning systems are   competitive for pattern recognition [Publicaci&oacute;n peri&oacute;dica]&nbsp;//   Evolutionary Intelligence.&nbsp;- 2008.&nbsp;- 3&nbsp;: Vol. 1.</font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BERNAD&Oacute;-MANSILLA ESTER AND   GARRELL-GUIU, JOSEP MARIA Accuracy-based   Learning Classifier Systems: Models, Analysis and Applications to   Classification Tasks [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Evol. Comput..&nbsp;-   Cambridge, MA, USA&nbsp;: MIT Press, 2003.&nbsp;- 3&nbsp;: Vol. 11.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">BOJARCZUK CELIA CRISTINA   AND LOPES, HEITOR SILV&Eacute;RIO AND FREITAS, ALEX ALVES AND MICHALKIEWICZ, EDSON   LUIZ A. Constrained-syntax   Genetic Programming System for Discovering Classification Rules: Application   to Medical Data Sets [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Artif. Intell.   Med..&nbsp;- Essex, UK&nbsp;: Elsevier Science Publishers Ltd., 2004.&nbsp;-   1&nbsp;: Vol. 30.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CANO ALBERTO, ZAFRA AMELIA   Y VENTURA SEBASTI&Aacute;N An   interpretable classification rule mining algorithm [Publicaci&oacute;n   peri&oacute;dica]&nbsp;// Information Sciences.&nbsp;2013. - Vol. 240.&nbsp;- p&aacute;gs. 1-20.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CASTRO AGUILAR GILBERTO   FERNANDO [y otros]   M&eacute;todo para el aseguramiento de ingresos en entornos de desarrollo de software   [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Revista Cubana de Ciencias   Inform&aacute;ticas.&nbsp;- Noviembre de 2016.&nbsp;- Especial UCIENCIA&nbsp;: Vol.   10.&nbsp;- p&aacute;gs. 43-57.    </font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">CORDERO MORALES DASIEL [y   otros] Sistema de   Razonamiento Basado en Casos para la identificaci&oacute;n de riesgos de software   [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Revista Cubana de Ciencias Inform&aacute;ticas.&nbsp;&ndash;   2013. Vol. 7.&nbsp;No. 2. -   p&aacute;gs. 95-107. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DERRAC JOAQU&Iacute;N [y otros] A practical tutorial on the use of   nonparametric statistical test as a methodology for comparing evolutionary and   swarm intelligence algorithms [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Swarm and   Evolutionary Computation.&nbsp;- [s.l.]&nbsp;: Elsevier B.V, 2011.&nbsp;-   1&nbsp;: Vol. 1.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">DOMINGOS PEDRO Y PAZZANI   MICHAEL On the Optimality of   the Simple Bayesian Classifier Under Zero-One Loss [Publicaci&oacute;n   peri&oacute;dica]&nbsp;// Machine Learning.&nbsp;- Hingham, MA, USA&nbsp;: Kluwer   Academic Publishers, 1997.&nbsp;- 2-3.&nbsp;- p&aacute;gs. 103-130.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ESPEJO PEDRO G., VENTURA   SEBASTI&Aacute;N Y HERRERA FRANCISCO. A Survey on the Application of Genetic Programming to Classification   [Publicaci&oacute;n peri&oacute;dica]&nbsp;// IEEE Transactions on Systems, Man, and   Cybernetics.&nbsp;- 2009.&nbsp;- Vol. Part C: Applications and Reviews.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">FERREIRA C&Acirc;NDIDA. Gene Expression Programming: Mathematical   Modeling by an Artificial Intelligence. Revised and extended edition   [Libro].&nbsp;- [s.l.]&nbsp;: Springer, 2006.&nbsp;- Vol. 2nd Edition&nbsp;:   p&aacute;g. 478.&nbsp;- ISBN 3-540-32796-7.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GARC&Iacute;A-VACACELA   ROBERTO [y otros] Experiencias   usando algoritmos gen&eacute;ticos en la planificaci&oacute;n de proyectos [Publicaci&oacute;n   peri&oacute;dica]&nbsp;// Revista Cubana de Ciencias Inform&aacute;ticas.&nbsp;&ndash; 2016. Vol. 10.&nbsp;No.   Especial UCIENCIA, Noviembre- p&aacute;gs. 71-86. </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GONZ&Aacute;LEZ   ANTONIO AND P&Eacute;REZ, RA&Uacute;L. SLAVE:   A Genetic Learning System Based on an Iterative Approach [Publicaci&oacute;n   peri&oacute;dica]&nbsp;// Trans. Fuz Sys..&nbsp;- Piscataway, NJ, USA&nbsp;: IEEE   Press, 1999.&nbsp;- 2&nbsp;: Vol. 7.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">GUERRERO-ENAMORADO ALAIN [y   otros] An algorithm   evaluation for discovering classification rules with gene expression   programming [Publicaci&oacute;n peri&oacute;dica]&nbsp;// International Journal of   Computational Intelligence Systems.&nbsp;- 2016.&nbsp;- 2&nbsp;: Vol. 9.    </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MAR&Iacute;N-S&Aacute;NCHEZ JACQUELINE [y   otros] Proceso para   la planificaci&oacute;n y control de proyectos de software utilizando Xedro-GESPRO   [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Revista Cubana de Ciencias   Inform&aacute;ticas.&nbsp;&ndash; 2014. Vol.   8.&nbsp;No. 2. - p&aacute;gs. 144-161. </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">MCCLELLAND JAMES L.,   RUMELHART DAVID E. Y PDP. Research Group Parallel Distributed Processing: Explorations in the   Microstructure of Cognition, Vol. 1: Foundations [Libro].&nbsp;- Cambridge,   MA, USA&nbsp;: MIT Press, 1986.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">OLMO ORTIZ, JUAN LUIS. Miner&iacute;a de Datos mediante   Programaci&oacute;n Autom&aacute;tica con Colonias de Hormigas [Tesis].&nbsp;- C&oacute;rdoba,   Espa&ntilde;a : Universidad de C&oacute;rdoba, Servicio de Publicaciones, 2013.     </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">ORRIOLS-PUIG ALBERT,   CASILLAS JORGE Y BERNAD&Oacute;-MANSILLA ESTER Genetic-based machine learning systems are   competitive for pattern recognition [Publicaci&oacute;n peri&oacute;dica]&nbsp;//   Evolutionary Intelligence.&nbsp;- [s.l.]&nbsp;: Springer, 2008.&nbsp;-   3&nbsp;: Vol. 1.&nbsp;- p&aacute;gs. 209-232.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">OTERO JOS&Eacute; AND S&Aacute;NCHEZ,   LUCIANO Induction of   descriptive fuzzy classifiers with the Logitboost algorithm [Publicaci&oacute;n   peri&oacute;dica]&nbsp;// Soft Computing.&nbsp;- [s.l.]&nbsp;: Springer-Verlag,   2006.&nbsp;- 9&nbsp;: Vol. 10.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">PI&Ntilde;ERO P&Eacute;REZ PEDRO Y. [y otros] Repositorio para el desarrollo   de investigaciones en Gesti&oacute;n de Proyectos [Publicaci&oacute;n peri&oacute;dica].&nbsp;- La   Habana&nbsp;: [s.n.], 2016.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">TAN K. C. AND YU, Q. AND   ANG, J. H. A coevolutionary   algorithm for rules discovery in data mining [Publicaci&oacute;n peri&oacute;dica]&nbsp;//   International Journal of Systems Science.&nbsp;- 2006.&nbsp;- 37&nbsp;: Vol.   12.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">TAN KAY CHEN AND TAY,   ARTHUR AND LEE, TONG HENG AND HENG, C. M. Mining multiple comprehensible classification rules   using genetic programming [Conferencia]&nbsp;// Proceedings of the 2002   Congress on Evolutionary Computation CEC2002.&nbsp;- [s.l.]&nbsp;: IEEE Press,   2002.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">THE STANDISH GROUP   INTERNATIONAL CHAOS REPORT [Informe].&nbsp;-   New York&nbsp;: The Standish Group International, Inc, 2014.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">VAPNIK VLADIMIR NAUMOVICH The nature of Statistical Learning Theory   [Libro].&nbsp;- New York, USA&nbsp;: Springer-Verlag, 1995.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">VENTURA SEBASTI&Aacute;N AND   ROMERO, CRIST&Oacute;BAL AND ZAFRA, AMELIA AND DELGADO, JOS&Eacute; Y A. AND HERV&Aacute;S C&Eacute;SAR JCLEC: A Java Framework for Evolutionary   Computation [Publicaci&oacute;n peri&oacute;dica]&nbsp;// Soft Computing.&nbsp;- Berlin,   Heidelberg&nbsp;: Springer-Verlag, 2008.&nbsp;- 4&nbsp;: Vol. 12.    </font></p>     <!-- ref --><p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">WITTEN IAN H., FRANK EIBE Y   HALL MARK A. Data Mining.   Practical Machine Learning Tools and Techniques [Libro].&nbsp;- MA 01803,   USA&nbsp;: Elsevier Inc., 2011.&nbsp;- ISBN 978-0-12-374856-0.     </font></p>     <p align="left">     <p align="left">     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 10/05/2017    ]]></body>
<body><![CDATA[<br> Aceptado: 04/09/2017</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ALCALÁ-FDEZ]]></surname>
<given-names><![CDATA[JESÚS]]></given-names>
</name>
</person-group>
<source><![CDATA[KEEL Data-Mining Software Tool: Data Set Repository, Integration of Algorithms and Experimental Analysis Framework]]></source>
<year>2011</year>
<page-range>255-287</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BACARDIT]]></surname>
<given-names><![CDATA[JAUME]]></given-names>
</name>
</person-group>
<source><![CDATA[Pittsburgh genetic-based machine learning in the data mining era: representations and generalization and run-time]]></source>
<year>2004</year>
<publisher-name><![CDATA[University Ramon LLull]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BERNADÓ-MANSILLA]]></surname>
<given-names><![CDATA[ESTER]]></given-names>
</name>
<name>
<surname><![CDATA[ORRIOLS-PUIG]]></surname>
<given-names><![CDATA[ALBERT]]></given-names>
</name>
<name>
<surname><![CDATA[CASILLAS]]></surname>
<given-names><![CDATA[JORGE]]></given-names>
</name>
</person-group>
<source><![CDATA[Genetic-based machine learning systems are competitive for pattern recognition]]></source>
<year>2008</year>
<volume>1</volume>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BERNADÓ-MANSILLA]]></surname>
<given-names><![CDATA[ESTER]]></given-names>
</name>
<name>
<surname><![CDATA[GARRELL-GUIU]]></surname>
<given-names><![CDATA[JOSEP MARIA]]></given-names>
</name>
</person-group>
<source><![CDATA[Accuracy-based Learning Classifier Systems: Models, Analysis and Applications to Classification Tasks]]></source>
<year>2003</year>
<volume>11</volume>
<publisher-name><![CDATA[MIT Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BOJARCZUK]]></surname>
<given-names><![CDATA[CELIA CRISTINA]]></given-names>
</name>
<name>
<surname><![CDATA[LOPES]]></surname>
<given-names><![CDATA[HEITOR SILVÉRIO]]></given-names>
</name>
<name>
<surname><![CDATA[FREITAS]]></surname>
<given-names><![CDATA[ALEX ALVES]]></given-names>
</name>
<name>
<surname><![CDATA[MICHALKIEWICZ]]></surname>
<given-names><![CDATA[EDSON LUIZ A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Constrained-syntax Genetic Programming System for Discovering Classification Rules: Application to Medical Data]]></source>
<year>2004</year>
<volume>30</volume>
<publisher-name><![CDATA[Elsevier Science Publishers Ltd.]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CANO]]></surname>
<given-names><![CDATA[ALBERTO]]></given-names>
</name>
<name>
<surname><![CDATA[AMELIA]]></surname>
<given-names><![CDATA[ZAFRA]]></given-names>
</name>
<name>
<surname><![CDATA[VENTURA]]></surname>
<given-names><![CDATA[SEBASTIÁN]]></given-names>
</name>
</person-group>
<source><![CDATA[An interpretable classification rule mining algorithm]]></source>
<year>2013</year>
<volume>240</volume>
<page-range>1-20</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CASTRO AGUILAR]]></surname>
<given-names><![CDATA[GILBERTO FERNANDO]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Método para el aseguramiento de ingresos en entornos de desarrollo de software]]></article-title>
<source><![CDATA[]]></source>
<year>Novi</year>
<month>em</month>
<day>br</day>
<volume>10</volume>
<numero>Especial UCIENCIA</numero>
<issue>Especial UCIENCIA</issue>
<page-range>43-57</page-range><publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CORDERO MORALES]]></surname>
<given-names><![CDATA[DASIEL]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Sistema de Razonamiento Basado en Casos para la identificación de riesgos de software]]></article-title>
<source><![CDATA[]]></source>
<year>2013</year>
<volume>7</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>95-107</page-range><publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas.]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DERRAC]]></surname>
<given-names><![CDATA[JOAQUÍN]]></given-names>
</name>
</person-group>
<source><![CDATA[A practical tutorial on the use of nonparametric statistical test as a methodology for comparing evolutionary and swarm intelligence algorithms]]></source>
<year>2011</year>
<volume>Vol. 1</volume>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[DOMINGOS]]></surname>
<given-names><![CDATA[PEDRO]]></given-names>
</name>
<name>
<surname><![CDATA[PAZZANI]]></surname>
<given-names><![CDATA[MICHAEL]]></given-names>
</name>
</person-group>
<source><![CDATA[On the Optimality of the Simple Bayesian Classifier Under Zero-One Loss]]></source>
<year>1997</year>
<page-range>103-130</page-range><publisher-name><![CDATA[Kluwer Academic Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ESPEJO]]></surname>
<given-names><![CDATA[PEDRO G.]]></given-names>
</name>
<name>
<surname><![CDATA[VENTURA]]></surname>
<given-names><![CDATA[SEBASTIÁN]]></given-names>
</name>
<name>
<surname><![CDATA[HERRERA]]></surname>
<given-names><![CDATA[FRANCISCO]]></given-names>
</name>
</person-group>
<source><![CDATA[A Survey on the Application of Genetic Programming to Classification]]></source>
<year>2009</year>
<volume>Part C</volume>
<publisher-name><![CDATA[Applications and Reviews]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FERREIRA]]></surname>
<given-names><![CDATA[CÂNDIDA]]></given-names>
</name>
</person-group>
<source><![CDATA[Gene Expression Programming: Mathematical Modeling by an Artificial Intelligence.]]></source>
<year>2006</year>
<edition>2nd Edition</edition>
<page-range>478</page-range><publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GARCÍA-VACACELA]]></surname>
<given-names><![CDATA[ROBERTO]]></given-names>
</name>
</person-group>
<source><![CDATA[Experiencias usando algoritmos genéticos en la planificación de proyectos]]></source>
<year>2016</year>
<volume>10</volume>
<page-range>71-86</page-range><publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas.]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GONZÁLEZ]]></surname>
<given-names><![CDATA[ANTONIO]]></given-names>
</name>
<name>
<surname><![CDATA[PÉREZ]]></surname>
<given-names><![CDATA[RAÚL]]></given-names>
</name>
</person-group>
<source><![CDATA[SLAVE: A Genetic Learning System Based on an Iterative Approach]]></source>
<year>1999</year>
<volume>7</volume>
<publisher-name><![CDATA[IEEE Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GUERRERO-ENAMORADO]]></surname>
<given-names><![CDATA[ALAIN]]></given-names>
</name>
</person-group>
<source><![CDATA[An algorithm evaluation for discovering classification rules with gene expression programming]]></source>
<year></year>
<volume>2016</volume><volume>9</volume>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MARÍN-SÁNCHEZ]]></surname>
<given-names><![CDATA[JACQUELINE]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Proceso para la planificación y control de proyectos de software utilizando Xedro-GESPRO]]></article-title>
<source><![CDATA[]]></source>
<year>2014</year>
<volume>8</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>144-161</page-range><publisher-name><![CDATA[Revista Cubana de Ciencias Informáticas.]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MCCLELLAND]]></surname>
<given-names><![CDATA[JAMES L.]]></given-names>
</name>
<name>
<surname><![CDATA[RUMELHART]]></surname>
<given-names><![CDATA[DAVID E]]></given-names>
</name>
</person-group>
<source><![CDATA[Research Group Parallel Distributed Processing: Explorations in the Microstructure of Cognition]]></source>
<year>1986</year>
<volume>1</volume>
<publisher-name><![CDATA[MIT Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[OLMO ORTIZ]]></surname>
<given-names><![CDATA[JUAN LUIS]]></given-names>
</name>
</person-group>
<source><![CDATA[Minería de Datos mediante Programación Automática con Colonias de Hormigas]]></source>
<year>2013</year>
<publisher-loc><![CDATA[^eCórdoba Córdoba]]></publisher-loc>
<publisher-name><![CDATA[Universidad de Córdoba]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ORRIOLS-PUIG]]></surname>
<given-names><![CDATA[ALBERT]]></given-names>
</name>
<name>
<surname><![CDATA[CASILLAS]]></surname>
<given-names><![CDATA[JORGE]]></given-names>
</name>
<name>
<surname><![CDATA[BERNADÓ-MANSILLA]]></surname>
<given-names><![CDATA[ESTER]]></given-names>
</name>
</person-group>
<source><![CDATA[Genetic-based machine learning systems are competitive for pattern recognition]]></source>
<year></year>
<volume>1</volume>
<page-range>209-232</page-range><publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[OTERO]]></surname>
<given-names><![CDATA[JOSÉ]]></given-names>
</name>
<name>
<surname><![CDATA[SÁNCHEZ]]></surname>
<given-names><![CDATA[LUCIANO]]></given-names>
</name>
</person-group>
<source><![CDATA[Induction of descriptive fuzzy classifiers with the Logitboost algorithm]]></source>
<year>2006</year>
<volume>10</volume>
<publisher-name><![CDATA[Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[PIÑERO PÉREZ]]></surname>
<given-names><![CDATA[PEDRO Y.]]></given-names>
</name>
</person-group>
<source><![CDATA[Repositorio para el desarrollo de investigaciones en Gestión de Proyectos]]></source>
<year>2016</year>
<publisher-loc><![CDATA[^eLa Habana La Habana]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TAN]]></surname>
<given-names><![CDATA[K. C.]]></given-names>
</name>
<name>
<surname><![CDATA[YU]]></surname>
<given-names><![CDATA[Q]]></given-names>
</name>
<name>
<surname><![CDATA[ANG]]></surname>
<given-names><![CDATA[J. H. A]]></given-names>
</name>
</person-group>
<source><![CDATA[coevolutionary algorithm for rules discovery in data mining]]></source>
<year>2006</year>
<volume>12</volume>
</nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TAN KAY]]></surname>
<given-names><![CDATA[CHEN]]></given-names>
</name>
<name>
<surname><![CDATA[TAY]]></surname>
<given-names><![CDATA[ARTHUR]]></given-names>
</name>
<name>
<surname><![CDATA[TONG HENG]]></surname>
<given-names><![CDATA[LEE]]></given-names>
</name>
<name>
<surname><![CDATA[HENG]]></surname>
<given-names><![CDATA[C. M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Mining multiple comprehensible classification rules using genetic programming]]></source>
<year>2002</year>
<publisher-name><![CDATA[IEEE Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<collab>THE STANDISH GROUP INTERNATIONAL CHAOS REPORT</collab>
<source><![CDATA[Informe]]></source>
<year>2014</year>
<publisher-loc><![CDATA[^eNew York New York]]></publisher-loc>
<publisher-name><![CDATA[The Standish Group International, Inc,]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[VAPNIK]]></surname>
<given-names><![CDATA[VLADIMIR NAUMOVICH]]></given-names>
</name>
</person-group>
<source><![CDATA[The nature of Statistical Learning Theory]]></source>
<year>1995</year>
<publisher-loc><![CDATA[^eNew York New York]]></publisher-loc>
<publisher-name><![CDATA[Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[VENTURA]]></surname>
<given-names><![CDATA[SEBASTIÁN]]></given-names>
</name>
<name>
<surname><![CDATA[ROMERO]]></surname>
<given-names><![CDATA[CRISTÓBAL]]></given-names>
</name>
<name>
<surname><![CDATA[ZAFRA]]></surname>
<given-names><![CDATA[AMELIA]]></given-names>
</name>
<name>
<surname><![CDATA[DELGADO]]></surname>
<given-names><![CDATA[JOSÉ Y A.]]></given-names>
</name>
<name>
<surname><![CDATA[HERVÁS]]></surname>
<given-names><![CDATA[CÉSAR]]></given-names>
</name>
</person-group>
<source><![CDATA[JCLEC: A Java Framework for Evolutionary Computation]]></source>
<year>2008</year>
<volume>12</volume>
<publisher-loc><![CDATA[^eBerlin Berlin]]></publisher-loc>
<publisher-name><![CDATA[Heidelberg : Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[WITTEN]]></surname>
<given-names><![CDATA[IAN H.]]></given-names>
</name>
<name>
<surname><![CDATA[EIBE]]></surname>
<given-names><![CDATA[FRANK]]></given-names>
</name>
<name>
<surname><![CDATA[HALL]]></surname>
<given-names><![CDATA[MARK A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Mining. Practical Machine Learning Tools and Techniques]]></source>
<year>2011</year>
<publisher-name><![CDATA[Elsevier Inc.]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
