<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2227-1899</journal-id>
<journal-title><![CDATA[Revista Cubana de Ciencias Informáticas]]></journal-title>
<abbrev-journal-title><![CDATA[Rev cuba cienc informat]]></abbrev-journal-title>
<issn>2227-1899</issn>
<publisher>
<publisher-name><![CDATA[Editorial Ediciones Futuro]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2227-18992015000400008</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Desempeño de algoritmos de minería en indicadores académicos: Árbol de Decisión y Regresión Logística]]></article-title>
<article-title xml:lang="en"><![CDATA[Performance of data mining algorithms in academic indicators: Decision Tree and Logistic Regression]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Menes Camejo]]></surname>
<given-names><![CDATA[Iván]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Arcos Medina]]></surname>
<given-names><![CDATA[Gloria]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Gallegos Carrillo]]></surname>
<given-names><![CDATA[Katherine]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Escuela Superior Politécnica de Chimborazo  ]]></institution>
<addr-line><![CDATA[Riobamba ]]></addr-line>
<country>Ecuador</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2015</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2015</year>
</pub-date>
<volume>9</volume>
<numero>4</numero>
<fpage>104</fpage>
<lpage>117</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S2227-18992015000400008&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S2227-18992015000400008&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S2227-18992015000400008&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La minería de datos se orienta a la presentación prospectiva de información, y para ello, es necesario escoger un algoritmo apropiado que ofrezca los mejores resultados, según el tipo de datos y los objetivos del proyecto. En este documento se presenta un estudio de desempeño de los algoritmos de minería de datos: Árbol de Decisión y Regresión Logística, aplicados a los datos continuos y discretos generados por la función académica de una institución de educación superior. Se buscó determinar el algoritmo con el mejor desempeño a través del uso del método científico y técnicas de estadística descriptiva e inferencial, y los resultados presentan que: no existe una diferencia significativa en el uso de RAM de los algoritmos, el algoritmo de Árbol de Decisión tiene menor tiempo de respuesta, y mayor precisión que el de Regresión Logística, mientras que este último tiene un mejor uso de CPU, concluyendo que el algoritmo de Árbol de Decisión es el de mejor desempeño para el escenario planteado.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Data mining is aimed at prospective reporting, for which is necessary to choose the most appropriate algorithm, i.e. the one that provides the best results, depending on data types and project objectives. In this paper a study of performance of two data mining algorithms is presented, namely Decision Tree and Logistic Regression, which have been applied to continuous and discrete data generated by the academic function of an institution of higher education. We sought to determine the algorithm with the best performance by means of the scientific method and descriptive and inferential statistical techniques. The results show that the decision tree algorithm is the best algorithm in terms of indicators of response time, CPU usage, RAM usage and accuracy.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[análisis de desempeño]]></kwd>
<kwd lng="es"><![CDATA[indicadores académicos]]></kwd>
<kwd lng="es"><![CDATA[árbol de decisión]]></kwd>
<kwd lng="es"><![CDATA[regresión logística]]></kwd>
<kwd lng="es"><![CDATA[minería de datos]]></kwd>
<kwd lng="en"><![CDATA[performance analysis]]></kwd>
<kwd lng="en"><![CDATA[academy indicators]]></kwd>
<kwd lng="en"><![CDATA[decision tree]]></kwd>
<kwd lng="en"><![CDATA[logistic regression]]></kwd>
<kwd lng="en"><![CDATA[data mining]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><B>ART&Iacute;CULO  ORIGINAL</B></font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="4">Desempe&ntilde;o  de algoritmos de miner&iacute;a en indicadores acad&eacute;micos: &Aacute;rbol de Decisi&oacute;n y  Regresi&oacute;n Log&iacute;stica</font></strong></font></p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><strong>Performance of data mining algorithms in academic  indicators: Decision Tree and Logistic Regression</strong></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Iv&aacute;n Menes Camejo<strong><strong><sup>1*</sup></strong></strong>,  Gloria Arcos Medina<strong><strong><sup>1</sup></strong></strong>, Katherine Gallegos Carrillo<strong><strong><sup>1</sup></strong></strong></strong></font> </p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><sup>1</sup> Escuela Superior Polit&eacute;cnica de Chimborazo.  Panamericana Sur km 11/2, Riobamba - Ecuador. imenes, kgallegos, garcos  @espoch.edu.ec</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">    ]]></body>
<body><![CDATA[<br>   * Autor para correspondencia:  imenes@espoch.edu.ec</font></p>     <p>&nbsp;</p> <hr>     <P><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>RESUMEN</b> </font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La miner&iacute;a de datos se orienta a la presentaci&oacute;n  prospectiva de informaci&oacute;n, y para ello, es necesario escoger un algoritmo  apropiado que ofrezca los mejores resultados, seg&uacute;n el tipo de datos y los  objetivos del proyecto. En este documento se presenta un estudio de desempe&ntilde;o  de los algoritmos de miner&iacute;a de datos: &Aacute;rbol de Decisi&oacute;n y Regresi&oacute;n Log&iacute;stica,  aplicados a los datos continuos y discretos generados por la funci&oacute;n acad&eacute;mica  de una instituci&oacute;n de educaci&oacute;n superior. Se busc&oacute; determinar el algoritmo con  el mejor desempe&ntilde;o a trav&eacute;s del uso del m&eacute;todo cient&iacute;fico y t&eacute;cnicas de  estad&iacute;stica descriptiva e inferencial, y los resultados presentan que: no  existe una diferencia significativa en el uso de RAM de los algoritmos, el algoritmo  de &Aacute;rbol de Decisi&oacute;n tiene menor tiempo de respuesta, y mayor precisi&oacute;n que el  de Regresi&oacute;n Log&iacute;stica, mientras que este &uacute;ltimo tiene un mejor uso de CPU,  concluyendo que el algoritmo de &Aacute;rbol de Decisi&oacute;n es el de mejor desempe&ntilde;o para  el escenario planteado.    <br>       <br>   <strong>Palabras clave:</strong> an&aacute;lisis de desempe&ntilde;o,  indicadores acad&eacute;micos, &aacute;rbol de decisi&oacute;n, regresi&oacute;n log&iacute;stica, miner&iacute;a de  datos.</font></p> <hr>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b><span lang=EN-GB>ABSTRACT</span></b> </font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Data mining is aimed at prospective reporting, for which is necessary to  choose the most appropriate algorithm, i.e. the one that provides the best  results, depending on data types and project objectives. In this paper a study  of performance of two data mining algorithms is presented, namely Decision Tree  and Logistic Regression, which have been applied to continuous and discrete  data generated by the academic function of an institution of higher education.  We sought to determine the algorithm with the best performance by means of the  scientific method and descriptive and inferential statistical techniques. The results show that the decision tree algorithm is  the best algorithm in terms of indicators of response time, CPU usage, RAM  usage and accuracy.     <br>       <br> <strong>Keywords:</strong> performance analysis, academy indicators, decision  tree, logistic regression, data mining.</font></p> <hr>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font size="3" face="Verdana, Arial, Helvetica, sans-serif"><b>INTRODUCCI&Oacute;N</b></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Data Mining es  el proceso de analizar datos usando metodolog&iacute;as automatizadas para encontrar  patrones escondidos (MacLennan, 2008). Los procesos de miner&iacute;a de datos apuntan  al uso del conjunto de datos generado por un proceso o negocio, con el fin de  obtener informaci&oacute;n que apoye a la toma de decisiones de los niveles ejecutivos  (Fayyad, y otros, 1996) (Han, 2006); a trav&eacute;s de la automatizaci&oacute;n del proceso  de encontrar informaci&oacute;n predecible en grandes bases de datos y la respuesta a  preguntas que tradicionalmente requer&iacute;an un intenso an&aacute;lisis manual (Vallejos,  2006). Por su definici&oacute;n, la miner&iacute;a de datos es aplicable a los procesos  educativos (Huebner, 2013), tal es as&iacute; que a nivel investigativo se ha formado  una rama denominada Miner&iacute;a de Datos Educativa, en la que se hace uso de las  t&eacute;cnicas de b&uacute;squeda de patrones y predicci&oacute;n, para hallar informaci&oacute;n que  aporte a mejorar la calidad educativa (Merceron, y otros, 2005).    <br>       <br>   Para aplicar un  proyecto de miner&iacute;a de datos, en cualquier tipo de escenario, es necesario  realizar un estudio de los algoritmos disponibles, para determinar aquel que  mejor se acople a las necesidades del proyecto a realizar (Hern&aacute;ndez, y otros,  2004); por tal motivo, se ha desarrollado un estudio sobre el desempe&ntilde;o de los  algoritmos de &Aacute;rbol de Decisi&oacute;n y Regresi&oacute;n Log&iacute;stica de Microsoft, aplicado a  los datos acad&eacute;micos de una instituci&oacute;n de educaci&oacute;n superior.    <br>       <br> Estudios  anteriores como el de la Universidad de Minho en Portugal (Cortez, y otros,  2006), tom&oacute; los datos de los estudiantes de secundaria de dos instituciones  p&uacute;blicas del mismo pa&iacute;s, para realizar la aplicaci&oacute;n de t&eacute;cnicas de predicci&oacute;n.  Se probaron tres diferentes prop&oacute;sitos de miner&iacute;a y cuatro m&eacute;todos de miner&iacute;a de  datos. Los resultados obtenidos revelaron que es posible alcanzar una alta  precisi&oacute;n en la predicci&oacute;n, dados los datos de dos per&iacute;odos acad&eacute;micos. En la  universidad de Awadh, en India, se condujo un estudio sobre el rendimiento de  los estudiantes basados en un grupo de 60 alumnos de diferentes carreras  (Kumar, y otros, 2011). Se us&oacute; la tarea de clasificaci&oacute;n de miner&iacute;a sobre la  base de datos de los estudiantes para predecir la divisi&oacute;n de los mismos.  Informaci&oacute;n como la asistencia, pruebas, seminarios y tareas se recolectaron  para predecir el rendimiento al final del per&iacute;odo acad&eacute;mico.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Las t&eacute;cnicas de  la miner&iacute;a de datos provienen de la inteligencia artificial y de la  estad&iacute;stica, dichas t&eacute;cnicas son plasmadas en algoritmos, que despu&eacute;s se  aplican sobre un conjunto de datos para obtener resultados&nbsp; (Fayyad, y otros, 1996) (Moreno, y otros,  2001). Cada algoritmo est&aacute; dise&ntilde;ado para aceptar o arrojar diferentes tipos de  datos, por lo que desde esa perspectiva se pueden descartar los algoritmos que  no aceptan los tipos de datos existentes en cada proyecto (Chapman, 2000). En  este escenario, por el uso de datos tanto discretos como continuos, los  algoritmos de &Aacute;rbol de Decisi&oacute;n y Regresi&oacute;n Log&iacute;stica de Microsoft son  escogidos sobre los otros implementados por Data Tools de Microsoft Analysis  Services (SSDT), una herramienta asociada al desarrollo de bases de datos y  proyectos de inteligencia de negocios.    <br>       ]]></body>
<body><![CDATA[<br>   El algoritmo de Regresi&oacute;n  Log&iacute;stica es un tipo de an&aacute;lisis estad&iacute;stico orientado a la predicci&oacute;n de una  variable categ&oacute;rica en funci&oacute;n de otras variables consideradas como par&aacute;metros  predictores (Fern&aacute;ndez, 2011). Espec&iacute;ficamente el algoritmo implementado por  Microsoft resulta ser una variante del algoritmo de red neuronal. Este tipo de  algoritmo debido a que acepta cualquier tipo de entrada, es considerado como  flexible y se ajusta a varias tareas anal&iacute;ticas dentro de la miner&iacute;a de datos,  entre las que se pueden mencionar predicci&oacute;n, clasificaci&oacute;n y explorar y  ponderar los factores que contribuyen a un resultado espec&iacute;fico (Microsoft  Corporation, 2012).    <br>       <br>   Por su parte,  los &aacute;rboles de decisi&oacute;n y reglas que usan divisiones invariantes tienen una  forma de representaci&oacute;n simple, haciendo del modelo de inferencia relativamente  sencillo para el entendimiento del usuario (Microsoft Corporation, 2012). Un  modelo de &aacute;rboles de decisi&oacute;n tiene un nodo primario &uacute;nico que representa el  modelo y sus metadatos. Debajo del nodo primario aparecen &aacute;rboles  independientes que representan los atributos de predicci&oacute;n que se seleccionan.    <br>       <br>   Una variable  com&uacute;n a los algoritmos descritos anteriormente, es el desempe&ntilde;o, debido a que  se define como la caracter&iacute;stica relacionada con el tiempo de respuesta, uso de  recursos (RAM y CPU) y confiabilidad de las operaciones (IBM Corporation, 2003).  La confiabilidad de un algoritmo de predicci&oacute;n est&aacute; dada por la precisi&oacute;n con  la que un modelo resultante define el conjunto de datos de entrada. Este factor  es cuantificable con la herramienta de an&aacute;lisis Data Tools de Microsoft  (Microsoft Corporation, 2012). Se busc&oacute; determinar el algoritmo con mejor  desempe&ntilde;o entre: &Aacute;rbol de Decisi&oacute;n y Regresi&oacute;n Log&iacute;stica de Microsoft, sobre  datos continuos y discretos de indicadores acad&eacute;micos de una instituci&oacute;n de  educaci&oacute;n superior.    <br>   El presente  art&iacute;culo est&aacute; divido en dos secciones principales: la primera presenta la  metodolog&iacute;a computacional en la que se describe la variable de comparaci&oacute;n,  junto con las t&eacute;cnicas y herramientas usadas para la obtenci&oacute;n de valores de  los indicadores definidos para el desempe&ntilde;o, as&iacute; como los escenarios preparados  para&nbsp; el estudio comparativo; y la  siguiente secci&oacute;n de resultados en donde se analiza los datos obtenidos del  tiempo, uso de RAM, uso de CPU y precisi&oacute;n de los algoritmos de miner&iacute;a &Aacute;rbol  de Decisi&oacute;n y Regresi&oacute;n Log&iacute;stica, haciendo uso de estad&iacute;stica descriptiva para  definir el conjunto de datos resultante y el test no-param&eacute;trico de estad&iacute;stica  inferencial denominado &ldquo;Prueba de los rangos con signo de Wilcoxon&rdquo; para  evaluar las hip&oacute;tesis de trabajo, en donde se obtuvo que: el algoritmo &Aacute;rbol de  Decisi&oacute;n tiene m&aacute;s precisi&oacute;n y menor tiempo de respuesta que Regresi&oacute;n  Log&iacute;stica, mientras que este &uacute;ltimo hace un menor uso de CPU en sus  operaciones, en cuanto al uso de RAM no se detectaron diferencias estad&iacute;sticamente  significativas entre los datos obtenidos.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">MATERIALES Y M&Eacute;TODOS </font></strong></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Con el objetivo de determinar  el desempe&ntilde;o de los algoritmos de miner&iacute;a de datos citados anteriormente, se  procedi&oacute; de acuerdo a los siguientes pasos:</font></p> <ol>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Definir los par&aacute;metros de  comparaci&oacute;n, esto incluye definir la variable de desempe&ntilde;o y sus indicadores.</font></li>       ]]></body>
<body><![CDATA[<li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Dise&ntilde;ar el ambiente de pruebas y  escenarios de los cuales se han tomado las mediciones necesarias  correspondientes a una muestra de la poblaci&oacute;n definida.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Realizar el an&aacute;lisis descriptivo de  los resultados obtenidos de cada indicador.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Evaluaci&oacute;n estad&iacute;stica de resultados  mediante contrastes de hip&oacute;tesis.</font></li>     </ol>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><strong>Variable de  comparaci&oacute;n</strong>    <br>   Los algoritmos de predicci&oacute;n  pueden ser analizados por su complejidad espacial o la complejidad temporal al  momento de analizar los datos ingresados, pero debido a que se busca los  mejores resultados posibles con el algoritmo seleccionado, se analizar&aacute; el  desempe&ntilde;o, ya que, por su definici&oacute;n no s&oacute;lo se asocia a caracter&iacute;sticas de  ejecuci&oacute;n sino tambi&eacute;n de efectos del algoritmo sobre las entradas  proporcionadas. El desempe&ntilde;o est&aacute; relacionado con las caracter&iacute;sticas de tiempo  de ejecuci&oacute;n y respuesta, uso de recursos y confiabilidad de las operaciones &nbsp;(IBM  Corporation, 2003). Al ser el desempe&ntilde;o una variable de tipo compleja se  deben definir los indicadores de la misma, as&iacute; como los pesos que  proporcionar&aacute;n prioridad a cada uno de los criterios.    <br>       <br>   <u>Tiempo de  respuesta:</u> El tiempo de respuesta corresponde a un indicador de  la categor&iacute;a de velocidad y estar&aacute; medido en segundos. Este valor ha sido recogido  de la herramienta Data Tools. A menor tiempo de respuesta de un algoritmo  frente a una misma estructura de datos mejor puntuaci&oacute;n tendr&aacute;. Del 100% se  asigna a este indicador un 10% del peso total.    <br>       <br>   <u>Uso  del CPU:</u> El uso del CPU corresponde a la categor&iacute;a de uso de  recursos del computador; ha sido medido en porcentaje desde el monitor del  sistema. Un algoritmo tendr&aacute; mejor desempe&ntilde;o con respecto al uso de CPU cuanto  menor sea su valor. Se asigna a este indicador un 10% del peso total de  criterios.    ]]></body>
<body><![CDATA[<br>       <br>   <u>Uso  de Memoria:</u> El uso de memoria medido en Megabytes en el  monitor del sistema, al igual que el uso del CPU, ser&aacute; mejor en cuanto un  algoritmo utilice menos memoria frente a la misma estructura de datos. Se  asigna a este criterio un 10% del total.    <br>       <br>   <u>Precisi&oacute;n:</u> La  precisi&oacute;n es el indicador m&aacute;s importante a la hora de decidir qu&eacute; algoritmo  tiene un mejor desempe&ntilde;o por lo que se le asigna un 70% del total de la  decisi&oacute;n final. Este valor ser&aacute; obtenido de la herramienta Data Tools que  ofrece la opci&oacute;n &ldquo;Gr&aacute;fico de precisi&oacute;n&rdquo; y es la que ayuda a comparar los  modelos calculando la efectividad a trav&eacute;s de una poblaci&oacute;n normalizada. Una  mayor puntuaci&oacute;n es mejor (Microsoft  Corporation, 2012). La precisi&oacute;n es una magnitud adimensional que  demuestra cu&aacute;n bien un modelo describe el conjunto de datos de entrada.    <br>       <br>   <strong>Ambientes de prueba</strong>    <br>       <br>   El servidor sobre el que se practicaron las pruebas  tiene las caracter&iacute;sticas de hardware y software que se describen en la <a href="#t01">tabla  1</a>.</font></p>     <p align="center"><img src="/img/revistas/rcci/v9n4/t0108415.jpg" alt="t01" width="405" height="137"><a name="t01"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Este ambiente  de pruebas est&aacute; orientado a cubrir los objetivos relacionados a los ejes del  proceso acad&eacute;mico que son: ingreso, matriculaci&oacute;n, promoci&oacute;n y graduaci&oacute;n. Los  requerimientos se listan a continuaci&oacute;n:</font></p> <ul>       ]]></body>
<body><![CDATA[<li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Determinar patrones de comportamiento  para el ingreso de los estudiantes; por carrera y facultad.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Determinar patrones de comportamiento  para la matriculaci&oacute;n y selecci&oacute;n de asignatura de los estudiantes (n&uacute;mero de  asignaturas, n&uacute;mero de cr&eacute;ditos, nivel y &aacute;rea de las asignaturas, etc.); por  carrera, por nivel y por facultad.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Determinar los factores que tienen influencia  en los casos de deserci&oacute;n (retiros y p&eacute;rdida de la asignatura por asistencia);  por carrera, niveles, asignaturas, &aacute;reas de conocimiento y facultad.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Determinar patrones de comportamiento  en la promoci&oacute;n acad&eacute;mica de los estudiantes; por asignatura, nivel, &aacute;reas de  conocimiento, carrera y facultad.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Determinar los factores que influyen  en los escenarios de segunda y tercera matr&iacute;cula; por asignatura, nivel, &aacute;reas  de conocimiento, carrera y facultad.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Determinar los factores que inciden  en los casos de estudiantes con baja eficiencia terminal; por carrera y  facultad.</font></li>     </ul>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Para realizar la medici&oacute;n de  indicadores se ha tomado como poblaci&oacute;n el total de modelos de miner&iacute;a que  satisfacen los requisitos. Debido a que cada requisito exige diferentes niveles  de detalle, se tomaron en cuenta 528 modelos, siendo &eacute;ste el n&uacute;mero de la  poblaci&oacute;n, y el tama&ntilde;o de la muestra se define mediante la f&oacute;rmula (Fern&aacute;ndez,  1996):</font></p>     <p align="center"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">    <br>   <img width="241" height="42" src="/img/revistas/rcci/v9n4/fo0108415.jpg"></font></p>     ]]></body>
<body><![CDATA[<p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  valores de la f&oacute;rmula anterior se muestran en la <a href="#t02">tabla 2</a>. </font></p>     <p align="center"><img src="/img/revistas/rcci/v9n4/t0208415.jpg" alt="t02" width="564" height="233"><a name="t02"></a></p>     <p align="left"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Cada uno de los algoritmos ha sido aplicado a una estructura de datos  que satisface los requisitos definidos. Estas estructuras son un conjunto de  datos obtenidas con lenguaje SQL e integradas a la herramienta Data Tools a  trav&eacute;s de la opci&oacute;n de &ldquo;Vista de Datos&rdquo;. Los atributos usados para cada  estructura de datos se describen en la <a href="/img/revistas/rcci/v9n4/t0308415.jpg" target="_blank">tabla 3</a>.</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  escenarios surgen al momento de agregar un algoritmo a la estructura de datos;  es decir, se definen con la implementaci&oacute;n del algoritmo de &aacute;rbol de decisi&oacute;n y  regresi&oacute;n log&iacute;stica respectivamente. Los pasos a seguir para realizar este  proceso son:    <br>   a)  Seleccionar la definici&oacute;n del origen de la estructura de datos (relacional).    <br>   b)  Seleccionar el algoritmo de Regresi&oacute;n Log&iacute;stica para escenario 1 y &Aacute;rbol de  Decisi&oacute;n para escenario 2.    <br>   c)  Seleccionar el conjunto de datos de origen.    <br>   d)  Especificar los tipos de datos.    <br>   e)  Definir el conjunto de aprendizaje y de pruebas para el algoritmo.    <br>   f)  Dar un nombre al modelo y estructura de miner&iacute;a de datos.</font></p>     ]]></body>
<body><![CDATA[<p align="left">&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="3">RESULTADOS Y DISCUSI&Oacute;N </font></strong></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif"><strong><font size="2">Tiempo de Respuesta</font></strong><font size="2">    <br>       <br> El tiempo de respuesta fue  medido en segundos con la ayuda de la herramienta Data Tools de Microsoft. La <a href="#F01">figura  1</a> presenta un gr&aacute;fico resumen de los resultados.</font></font></p>     <p align="center"><img src="/img/revistas/rcci/v9n4/f0108415.jpg" alt="F01" width="440" height="262"><a name="F01"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">La  figura anterior muestra que los valores del tiempo de respuesta para el  algoritmo de regresi&oacute;n log&iacute;stica tienen mayor variaci&oacute;n que los valores del  algoritmo de &aacute;rbol de decisi&oacute;n. Los datos descriptivos indican que: la media de  los 76 valores de muestra para el algoritmo de &aacute;rbol de decisi&oacute;n es 8,54  segundos, con una desviaci&oacute;n est&aacute;ndar de 8,77; frente a 12,80 segundos del  algoritmo de regresi&oacute;n log&iacute;stica con una desviaci&oacute;n est&aacute;ndar de 28,42.    <br>       <br>     <a><strong>Uso del CPU</strong></a>     <br>         ]]></body>
<body><![CDATA[<br>   Este indicador fue tomado en  porcentaje con la ayuda del monitor de sistema de Microsoft. La <a href="#F02">figura 2</a> presenta  un gr&aacute;fico resumen de los resultados obtenidos de este proceso.</font></p>     <p align="center"><img src="/img/revistas/rcci/v9n4/f0208415.jpg" alt="F02" width="429" height="272"><a name="F02"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  valores obtenidos muestran gran variabilidad en el uso de CPU en los dos  algoritmos de estudio, siendo la media de los 76 valores tomados para el  algoritmo de &aacute;rbol de decisi&oacute;n de 0,65% con una desviaci&oacute;n est&aacute;ndar de 0,25;  mientras que el algoritmo de regresi&oacute;n log&iacute;stica tiene una media de 0,58% con  una desviaci&oacute;n est&aacute;ndar de 0,24.    <br>        <br>     <a><strong>Uso de RAM</strong></a>     <br>         <br>   Este indicador fue tomado en  Megabytes con la ayuda del monitor de sistema de Microsoft. La <a href="#F03">figura 3</a> presenta  un gr&aacute;fico resumen de los resultados obtenidos de este proceso.</font></p>     <p align="center"><img src="/img/revistas/rcci/v9n4/f0308415.jpg" alt="F03" width="442" height="257"><a name="F03"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  valores con respecto al uso de RAM mostrados en la gr&aacute;fica anterior, no  muestran una diferencia significativa entre los dos algoritmos de estudio;  siendo que la media de los 76 valores tomados para el algoritmo de &aacute;rbol de  decisi&oacute;n es 133,18 MB con una desviaci&oacute;n est&aacute;ndar de 22,77; mientras que para  el algoritmo de regresi&oacute;n log&iacute;stica la media es de 133,68 MB con 22,76 de  desviaci&oacute;n est&aacute;ndar.    <br>       ]]></body>
<body><![CDATA[<br>     <a><strong>Precisi&oacute;n</strong></a>     <br> </font>    <br>     <font size="2" face="Verdana, Arial, Helvetica, sans-serif">El indicador precisi&oacute;n es un  valor&nbsp; que se ha tomado de la herramienta  Data Tools de Microsoft. La <a href="#F04">figura 4</a> presenta un gr&aacute;fico resumen de los  resultados obtenidos de este proceso. </font></p>     <p align="center"><img src="/img/revistas/rcci/v9n4/f0408415.jpg" alt="F04" width="433" height="257"><a name="F04"></a></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los  valores de precisi&oacute;n de los algoritmos, mostrados en la gr&aacute;fica anterior,  muestran variabilidad en los dos casos de estudio, lo que se corrobora con los  datos descriptivos: el algoritmo de &aacute;rbol de decisi&oacute;n tienen una media de 0,75  en la precisi&oacute;n de los 76 modelos obtenidos con una desviaci&oacute;n est&aacute;ndar de  0,21; mientras que el algoritmo de regresi&oacute;n log&iacute;stica tiene una media de 0,74  con desviaci&oacute;n est&aacute;ndar de 0,20.    <br>       <br>     <a><strong>Contrastes de Hip&oacute;tesis    <br>     </strong></a>     <br>   Con  el objetivo de determinar el algoritmo de mejor desempe&ntilde;o para ser aplicado  sobre los datos acad&eacute;micos de la instituci&oacute;n de educaci&oacute;n superior, se han planteado  cuatro hip&oacute;tesis con respecto a los indicadores de desempe&ntilde;o definidos que son:  tiempo de respuesta, uso de CPU, uso de RAM y precisi&oacute;n. La hip&oacute;tesis nula en  las pruebas de comparaci&oacute;n de la media para cada indicador es que el desempe&ntilde;o  de los dos algoritmos es el mismo; por tanto se podr&aacute; determinar el algoritmo  con mayor desempe&ntilde;o en los casos en los que se rechace la hip&oacute;tesis nula en  estas pruebas de comparaci&oacute;n de medias.    <br>       ]]></body>
<body><![CDATA[<br>   Dado que el conjunto de datos  de muestra no cumple la hip&oacute;tesis de normalidad, se ha aplicado el test  no-param&eacute;trico denominado &ldquo;Prueba de los rangos con signo de Wilcoxon&rdquo; para  muestras relacionadas. Y los resultados se indican en la <a href="/img/revistas/rcci/v9n4/t0408415.jpg" target="_blank">tabla 4</a> a  continuaci&oacute;n:</font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A partir de la comparaci&oacute;n entre medias  muestrales, para aquellas variables en las que se rechaza Ho, se  puede determinar que hay suficiente evidencia estad&iacute;stica para afirmar que:</font></p> <ul type="disc">       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo de &Aacute;rbol de Decisi&oacute;n con 8,54 segundos supera en       tiempo de respuesta a Regresi&oacute;n Log&iacute;stica con 12,80 segundos.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo de Regresi&oacute;n Log&iacute;stica tiene una media de 0,58% con lo       que supera al algoritmo de &Aacute;rbol de Decisi&oacute;n, cuya media es de 0,65% con       respecto al uso del CPU.</font></li>       <li><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El algoritmo de &Aacute;rbol de Decisi&oacute;n tiene una media de 0,75 de       precisi&oacute;n; mientras que el Algoritmo de Regresi&oacute;n Log&iacute;stica tiene una       media de 0,74 de precisi&oacute;n, con lo que se define que &Aacute;rbol de Decisi&oacute;n       supera en la prueba de precisi&oacute;n.</font></li>     </ul>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Los resultados de tiempo de  respuesta y precisi&oacute;n favorecen al algoritmo de &Aacute;rbol de Decisi&oacute;n, mientras que  Regresi&oacute;n Log&iacute;stica lo supera en uso de CPU. El uso de RAM result&oacute; ser  semejante para ambos algoritmos. Debido a que la precisi&oacute;n es el indicador de  m&aacute;s peso para determinar el algoritmo de mejor desempe&ntilde;o, se escoge el  algoritmo de &Aacute;rbol de Decisi&oacute;n para ser aplicado en el an&aacute;lisis de indicadores  acad&eacute;micos de la educaci&oacute;n superior. </font></p>     <p align="left">&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>CONCLUSIONES</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">El an&aacute;lisis del desempe&ntilde;o de los algoritmos &Aacute;rbol de  Decisi&oacute;n y Regresi&oacute;n Log&iacute;stica, bajo los indicadores de tiempo de respuesta,  uso de CPU, uso de RAM y precisi&oacute;n, sobre datos de indicadores acad&eacute;micos,  revela que la precisi&oacute;n de dichos algoritmos es diferente. De esta forma se  establece que el algoritmo &Aacute;rbol de Decisi&oacute;n tiene mejor precisi&oacute;n, debido a  que el valor su media muestral es mayor. Cabe resaltar que el indicador  precisi&oacute;n es el m&aacute;s importante para establecer el desempe&ntilde;o de un algoritmo de  miner&iacute;a de datos.    ]]></body>
<body><![CDATA[<br>       <br>   Los algoritmos no presentan diferencia significativa  en el&nbsp; uso de RAM,&nbsp; lo que se puede adjudicar a que los  algoritmos fueron sometidos a pruebas bajo las mismas estructuras de datos y el  almacenamiento en RAM necesario para el proceso est&aacute; relacionado con cantidad  de datos de entrada proporcionado.    <br>       <br>   El uso del CPU de&nbsp;  los algoritmos &Aacute;rbol de Decisi&oacute;n y Regresi&oacute;n Log&iacute;stica es diferente y se  determina que Regresi&oacute;n Log&iacute;stica tiene un menor uso de este recurso frente a  &Aacute;rbol de Decisi&oacute;n.    <br>       <br>   En tiempo de respuesta, el algoritmo de &Aacute;rbol de  Decisi&oacute;n tiene una menor media frente al de Regresi&oacute;n Log&iacute;stica, por lo que se  puede concluir que lo hace m&aacute;s r&aacute;pido frente a un mismo escenario, debido a que  el segundo algoritmo usa un an&aacute;lisis para cada atributo de predicci&oacute;n mientras  que el primero usa los datos de entrada como un solo conjunto para el an&aacute;lisis.    <br> Bajo las circunstancias se&ntilde;aladas en los literales  anteriores, se determin&oacute; como el algoritmo de mejor desempe&ntilde;o sobre datos  acad&eacute;micos al algoritmo &Aacute;rbol de Decisi&oacute;n.</font></p> <font size="2" face="Verdana, Arial, Helvetica, sans-serif">Contar  con los datos socioecon&oacute;micos de los estudiantes aportar&aacute; con nuevos patrones  dentro de la extracci&oacute;n de conocimiento, por lo que en futuros trabajos se  insta a desarrollar un plan para integrar dicha informaci&oacute;n a un estudio de  algoritmos de miner&iacute;a. </font>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>AGRADECIMIENTOS</B></font></p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">A la  Escuela Superior Polit&eacute;cnica de Chimborazo por la informaci&oacute;n facilitada para  la realizaci&oacute;n de este estudio.</font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p align="left"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><B>REFERENCIAS    BIBLIOGR&Aacute;FICAS</B></font>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">- CHAPMAN, Pete and et.al. <em>CRISP-DM 1.0. </em>Washington D. C., EEUU&nbsp;: SPSS, 2000. p&aacute;gs. 1-76.    <br>       <!-- ref --><br> - CORTEZ, Paulo; SILVA, Alice. <em>Using Data  Minig to predict secondary school student performance. </em>Guimaraes,  Portugal&nbsp;: s.n., 2006.    <br>     <!-- ref --><br> - FAYYAD, Usama; PIATESKY, Gregory;  PADHRAIC, Smyth. <em>Knowledge Discovery in Databases. </em>1996. p&aacute;gs. 37-54.    <br>     <!-- ref --><br> - FERN&Aacute;NDEZ, Santiago. <em>Regresi&oacute;n  Log&iacute;stica. </em>Madrid&nbsp;: Universidad Aut&oacute;noma de Madrid, 2011.    <br>     ]]></body>
<body><![CDATA[<!-- ref --><br> - FERN&Aacute;NDEZ, Pita.  Investigaci&oacute;n: Determinaci&oacute;n del tama&ntilde;o muestral. Unidad de Epidemiolog&iacute;a  Cl&iacute;nica y Bioestad&iacute;stica. A Coru&ntilde;a. Cad Aten Primaria 1996. p&aacute;gs. 1-6.    <br>     <!-- ref --><br> - HAN,  Jiawei. <em>Introduction to Data Mining. </em>San  Francisco&nbsp;: Morgan Kaufmann, 2006. p&aacute;gs. 1-20.    <br>     <!-- ref --><br> - HERN&Aacute;NDEZ, Jos&eacute;; RAM&Iacute;REZ,  Jos&eacute;; FERRI, C&eacute;sar. Introducci&oacute;n a la Miner&iacute;a de Datos Madrid: Pearson, 2004.  p&aacute;gs. 3-39.    <br>     <!-- ref --><br> - HUEBNER,  Richard. <em>A survey of educational data-mining  research. </em>Norwich&nbsp;: Norwich University, 2013. p&aacute;g. 13.    <br>     <br> - IBM Corporation. Rational Unified  Process. <em>Concepts: Performance Testing. </em>[En l&iacute;nea] 2003. [Citado el: 8 de  11 de 2013.] http://students.mimuw.edu.pl/~zbyszek/posi/ibm/RUP_Eval/process/workflow/test/  co_perfo.htm.    <br>     ]]></body>
<body><![CDATA[<!-- ref --><br> - KUMAR, Brijesh y SAURABH, Pal. <em>Mining  Educational Data to analyze student&acute;s performance. </em>Rajasthan, India&nbsp;:  IJACSA, 2011. p&aacute;gs. 63-69.    <br>     <br> - MACLENNAN, Jamie. <em>Data Mining  with Microsoft SQL Server 2008. </em>Indianapolis, EEUU, Wiley Publishing Inc.  2008. p&aacute;gs. 39-53.    <br>     <!-- ref --><br> - MERCERON,  Agathe y KALINA, Yacef. <em>Educational Data Mining: a  Case Study. </em>Sydney&nbsp;: University of Sydney, 2005. p&aacute;gs. 1-8.    <br>     <br> - MICROSOFT CORPORATION.  Algoritmo de &Aacute;rboles de Decisi&oacute;n. [En l&iacute;nea] Microsoft Developer Network, 2012.  [Citado el: 6 de 11 de 2013.]  https://msdn.microsoft.com/es-ec/library/ms175312.aspx.    <br>     <br> - MICROSOFT CORPORATION.  Algoritmo Regresi&oacute;n Log&iacute;stica de Microsoft. [En l&iacute;nea] Microsoft Developer  Network, 2012. [Citado el: 6 de 11 de 2013.]  http://msdn.microsoft.com/es-es/library/ms174806.aspx.    <br>     ]]></body>
<body><![CDATA[<br> - MICROSOFT CORPORATION.  Algoritmos de miner&iacute;a de datos. [En l&iacute;nea] Microsoft Developer Network. [Citado  el: 6 de 11 de 2013.] https://msdn.microsoft.com/es-es/library/ms175595.aspx.    <br>     <!-- ref --><br> - MORENO, Mar&iacute;a; QUINTALES; Luis  y GARC&Iacute;A; Francisco. <em>Aplicaci&oacute;n de t&eacute;cnicas de miner&iacute;a de datos en la  construcci&oacute;n y validaci&oacute;n de modelos predictivos y asociativos a partir de  especificaciones de requisitos de software. </em>Salamanca&nbsp;: Universidad de  Salamanca, 2001. p&aacute;gs. 1-14.    <br>     <!-- ref --><br> - VALLEJOS, Sof&iacute;a. Miner&iacute;a de Datos. Corrientes,  Argentina, Universidad Nacional de Noreste, 2006,&nbsp; p&aacute;gs.  11-16.    </font></p>     <p name="_ENREF_1">&nbsp;</p>     <p name="_ENREF_1">&nbsp;</p>     <p><font size="2" face="Verdana, Arial, Helvetica, sans-serif">Recibido: 26/05/2015     <br> Aceptado: 14/09/2015 </font></p>     ]]></body>
<body><![CDATA[ ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHAPMAN]]></surname>
<given-names><![CDATA[Pete]]></given-names>
</name>
</person-group>
<source><![CDATA[CRISP-DM 1.0.]]></source>
<year>2000</year>
<page-range>1-76</page-range><publisher-loc><![CDATA[^eWashington D. C Washington D. C]]></publisher-loc>
<publisher-name><![CDATA[SPSS]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CORTEZ]]></surname>
<given-names><![CDATA[Paulo]]></given-names>
</name>
<name>
<surname><![CDATA[SILVA]]></surname>
<given-names><![CDATA[Alice]]></given-names>
</name>
</person-group>
<source><![CDATA[Using Data Minig to predict secondary school student performance]]></source>
<year>2006</year>
<publisher-loc><![CDATA[Guimaraes ]]></publisher-loc>
<publisher-name><![CDATA[s.n]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FAYYAD]]></surname>
<given-names><![CDATA[Usama]]></given-names>
</name>
<name>
<surname><![CDATA[PIATESKY]]></surname>
<given-names><![CDATA[Gregory]]></given-names>
</name>
<name>
<surname><![CDATA[PADHRAIC]]></surname>
<given-names><![CDATA[Smyth]]></given-names>
</name>
</person-group>
<source><![CDATA[Knowledge Discovery in Databases]]></source>
<year>1996</year>
<page-range>37-54</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FERNÁNDEZ]]></surname>
<given-names><![CDATA[Santiago]]></given-names>
</name>
</person-group>
<source><![CDATA[Regresión Logística]]></source>
<year>2011</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Autónoma de Madrid]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FERNÁNDEZ]]></surname>
<given-names><![CDATA[Pita]]></given-names>
</name>
</person-group>
<source><![CDATA[Investigación: Determinación del tamaño muestral]]></source>
<year>1996</year>
<page-range>1-6</page-range><publisher-loc><![CDATA[A Coruña ]]></publisher-loc>
<publisher-name><![CDATA[Cad Aten Primaria]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HAN]]></surname>
<given-names><![CDATA[Jiawei]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to Data Mining]]></source>
<year>2006</year>
<page-range>1-20</page-range><publisher-loc><![CDATA[San Francisco ]]></publisher-loc>
<publisher-name><![CDATA[Morgan Kaufmann]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HERNÁNDEZ]]></surname>
<given-names><![CDATA[José]]></given-names>
</name>
<name>
<surname><![CDATA[RAMÍREZ]]></surname>
<given-names><![CDATA[José]]></given-names>
</name>
<name>
<surname><![CDATA[FERRI]]></surname>
<given-names><![CDATA[César]]></given-names>
</name>
</person-group>
<source><![CDATA[Introducción a la Minería de Datos Madrid]]></source>
<year>2004</year>
<page-range>3-39</page-range><publisher-name><![CDATA[Pearson]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[HUEBNER]]></surname>
<given-names><![CDATA[Richard]]></given-names>
</name>
</person-group>
<source><![CDATA[A survey of educational data-mining research. Norwich]]></source>
<year>2013</year>
<page-range>13</page-range><publisher-name><![CDATA[Norwich University]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<collab>IBM Corporation</collab>
<source><![CDATA[Rational Unified Process: Concepts: Performance Testing.]]></source>
<year>2003</year>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KUMAR]]></surname>
<given-names><![CDATA[Brijesh]]></given-names>
</name>
<name>
<surname><![CDATA[SAURABH]]></surname>
<given-names><![CDATA[Pal]]></given-names>
</name>
</person-group>
<source><![CDATA[Mining Educational Data to analyze student´s performance. Rajasthan]]></source>
<year>2011</year>
<page-range>63-69</page-range><publisher-loc><![CDATA[^eIndia India]]></publisher-loc>
<publisher-name><![CDATA[IJACSA]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MACLENNAN]]></surname>
<given-names><![CDATA[Jamie]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Mining with Microsoft SQL Server]]></source>
<year>2008</year>
<page-range>39-53</page-range><publisher-loc><![CDATA[Indianapolis ]]></publisher-loc>
<publisher-name><![CDATA[Wiley Publishing Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MERCERON]]></surname>
<given-names><![CDATA[Agathe]]></given-names>
</name>
<name>
<surname><![CDATA[KALINA]]></surname>
<given-names><![CDATA[Yacef]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational Data Mining: a Case Study]]></source>
<year>2005</year>
<page-range>1-8</page-range><publisher-loc><![CDATA[Sydney ]]></publisher-loc>
<publisher-name><![CDATA[University of Sydney]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<collab>MICROSOFT CORPORATION</collab>
<source><![CDATA[Algoritmo de Árboles de Decisión]]></source>
<year>2012</year>
<publisher-name><![CDATA[Microsoft Developer Network]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="book">
<collab>MICROSOFT CORPORATION</collab>
<source><![CDATA[Algoritmo Regresión Logística de Microsoft]]></source>
<year>2012</year>
<publisher-name><![CDATA[Microsoft Developer Network]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="book">
<collab>MICROSOFT CORPORATION</collab>
<source><![CDATA[Algoritmos de minería de datos]]></source>
<year></year>
<publisher-name><![CDATA[Microsoft Developer Network]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MORENO]]></surname>
<given-names><![CDATA[María]]></given-names>
</name>
<name>
<surname><![CDATA[QUINTALES]]></surname>
<given-names><![CDATA[Luis]]></given-names>
</name>
<name>
<surname><![CDATA[GARCÍA]]></surname>
<given-names><![CDATA[Francisco]]></given-names>
</name>
</person-group>
<source><![CDATA[Aplicación de técnicas de minería de datos en la construcción y validación de modelos predictivos y asociativos a partir de especificaciones de requisitos de software]]></source>
<year>2001</year>
<page-range>1-14</page-range><publisher-loc><![CDATA[Salamanca ]]></publisher-loc>
<publisher-name><![CDATA[Universidad de Salamanca]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[VALLEJOS]]></surname>
<given-names><![CDATA[Sofía]]></given-names>
</name>
</person-group>
<source><![CDATA[Minería de Datos]]></source>
<year>2006</year>
<page-range>11-16</page-range><publisher-loc><![CDATA[Corrientes ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Nacional de Noreste]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
