<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0864-2141</journal-id>
<journal-title><![CDATA[Educación Médica Superior]]></journal-title>
<abbrev-journal-title><![CDATA[Educ Med Super]]></abbrev-journal-title>
<issn>0864-2141</issn>
<publisher>
<publisher-name><![CDATA[Centro Nacional de Información de Ciencias MédicasEditorial Ciencias Médicas]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0864-21411996000100001</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Las curvas ROC y las medidas de detectabilidad para la validación de predictores del rendimiento docente]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Bacallao Gallestey]]></surname>
<given-names><![CDATA[Jorge]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Instituto Superior de Ciencias Básicas y Preclínicas Victoria de Girón  ]]></institution>
<addr-line><![CDATA[Ciudad de La Habana ]]></addr-line>
<country>Cuba</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>1996</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>1996</year>
</pub-date>
<volume>10</volume>
<numero>1</numero>
<fpage>1</fpage>
<lpage>2</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_arttext&amp;pid=S0864-21411996000100001&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_abstract&amp;pid=S0864-21411996000100001&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.sld.cu/scielo.php?script=sci_pdf&amp;pid=S0864-21411996000100001&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Se introducen las conocidas curvas ROC (relative operating characteristic) y sus medidas de detectatibilidad asociadas, para la validación de varios predictores del rendimiento académico. Se hace énfasis en las ventajas de este instrumento sobre otras medidas clásicas conocidas como la sensibilidad y la especificidad, para comparar la efectividad de diferentes variables con fines pronósticos. Se exponen algunos resultados relacionados con el fundamento, la interpretación y las expresiones para el cálculo de las diferentes medidas de detectabilidad y se ilustra la aplicación de estas medidas para mostrar las ventajas del índice académico sobre las pruebas de ortografía en el pronóstico del aprovechamiento docente en la enseñanza médica superior.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[The well-know ROC curves (relative operating characteristic) and their associated detectability measures, are introdced for the validation of several predictors of the academic achievement. Emphasis is made on the advantages of this instrument over other know classic measures, as sensitivity and specificity, to compare the effectiveness of several variables with prognostic purposes. Several results related with the foundation, interpretation and expressions for calculating the different detectability measures, are exposed, and the application of these measures is illustrated, to show the advantages of the academic index over the orthography tests in the prognostic of the educational achievement in the superior medical education.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[LOGRO,]]></kwd>
<kwd lng="es"><![CDATA[CURVA ROC.]]></kwd>
<kwd lng="en"><![CDATA[ACHIEVEMENT]]></kwd>
<kwd lng="en"><![CDATA[ROC CURVES]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  Instituto Superior de Ciencias B&aacute;sicas y Precl&iacute;nicas "Victoria de  Gir&oacute;n" Ciudad de La Habana  <H2> Las curvas ROC y las medidas de detectabilidad para la validaci&oacute;n de predictores del rendimiento docente</H2> <I>Lic. Jorge Bacallao Gallestey<SUP>1</SUP></I> <OL>     <LI> <I>Licenciado en Matem&aacute;tica. Instituto Superior de Ciencias B&aacute;sicas y Precl&iacute;nicas "Victoria de Gir&oacute;n".</I></LI>     </OL>  <H4> RESUMEN</H4> Se introducen las conocidas curvas ROC <I>(relative operating characteristic)</I> y sus medidas de detectatibilidad asociadas, para la validaci&oacute;n de varios predictores del rendimiento acad&eacute;mico. Se hace &eacute;nfasis en las ventajas de este instrumento sobre otras medidas cl&aacute;sicas conocidas como la sensibilidad y la especificidad, para comparar la efectividad de diferentes variables con fines pron&oacute;sticos. Se exponen algunos resultados relacionados con el fundamento, la interpretaci&oacute;n y las expresiones para el c&aacute;lculo de las diferentes medidas de detectabilidad y se ilustra la aplicaci&oacute;n de estas medidas para mostrar las ventajas del &iacute;ndice acad&eacute;mico sobre las pruebas de ortograf&iacute;a en el pron&oacute;stico del aprovechamiento docente en la ense&ntilde;anza m&eacute;dica superior.      <P><I>Palabras clave:</I> LOGRO, CURVA ROC. <H4> INTRODUCCION</H4> El an&aacute;lisis de las curvas ROC surgi&oacute; como instrumento en el dominio tecnol&oacute;gico de la detecci&oacute;n de se&ntilde;ales y pronto encontr&oacute; sus primeras aplicaciones m&eacute;dicas en el campo de la Psicolog&iacute;a, particularmente en estudios de percepci&oacute;n, donde ha sido ampliamente utilizado.<SUP>1</SUP> Otras aplicaciones m&eacute;dicas incluyen la comparaci&oacute;n de t&eacute;cnicas de imagenolog&iacute;a<SUP>2,3</SUP> y de procedimientos diagn&oacute;sticos,<SUP>4</SUP> y m&aacute;s recientemente, la selecci&oacute;n de factores de riesgo.<SUP>5</SUP>      <P>Dif&iacute;cilmente pueda concebirse en medicina y epidemiolog&iacute;a un problema tan com&uacute;n como la segregaci&oacute;n entre sujetos sanos y enfermos sobre la base de un atributo continuo X. Este problema implica, usualmente, escoger un punto de corte c<SUB>o</SUB> que minimice alguna funci&oacute;n de la frecuencia relativa de falsos positivos y falsos negativos. La elecci&oacute;n del punto de corte y la correspondiente regla de decisi&oacute;n      <P>si X > c<SUB>o</SUB> entonces SANO      <P>si X <FONT FACE=Symbol>&pound;</FONT> c<SUB>o</SUB> entonces ENFERMO...      <P>da lugar a una tabla 2 x 2 como la que ilustra la tabla 1.     <CENTER>TABLA 1. <I>Tabla de clasificaci&oacute;n para el punto de corte c<SUB>o</SUB></I></CENTER>      <CENTER><TABLE BORDER=0 CELLPADDING=5 > <TR> <TD VALIGN=TOP WIDTH="33%">&nbsp;</TD>  <TD VALIGN=TOP COLSPAN="2" WIDTH="67%">     ]]></body>
<body><![CDATA[<CENTER>Grupo real</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">Clasificaci&oacute;n&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>Sanos (s)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>Enfermos (e)</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">Sano (S)&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>p (S/s)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>p (S/e)</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">Enfermos (E)&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>p (E/s)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>p (E/e)</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>1</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>1</CENTER> </TD> </TR> </TABLE></CENTER> <FONT SIZE=-1>p (E/e):probabilidad de clasificar como enfermo a un sujeto que realmente lo est&aacute; (probabilidad de verdadero positivo).</FONT>     <BR><FONT SIZE=-1>p (E/s):probabilidad de clasificar como enfermo a un sujeto sano (probabilidad de falso positivo).</FONT>     ]]></body>
<body><![CDATA[<BR><FONT SIZE=-1>p (S/s):probabilidad de clasificar como sano a un sujeto realmente sano (probabilidad de verdadero negativo).</FONT>     <BR><FONT SIZE=-1>p (S/e):probabilidad de clasificar como sano a un sujeto enfermo (probabilidad de falso negativo).</FONT>      <P>La curva ROC es el gr&aacute;fico, en un sistema de ejes cartesianos, de los valores de p (E/s) en el eje de las abscisas, contra p (E/e) en el de las ordenadas, para varios puntos de corte.      <P>Pese a que la predicci&oacute;n del aprovechamiento acad&eacute;mico se aviene perfectamente con este esquema, las curvas ROC no se han empleado para validar predictores del rendimento. En varios trabajos previos<SUP>6-8</SUP> Bacallao et al. han estudiado la relevancia de algunos predictores del rendimiento, pero utilizando enfoques diferentes. En un caso<SUP>6</SUP> mediante la aplicaci&oacute;n de un an&aacute;lisis de la varianza multidimensional con los <I>tests</I> de significaci&oacute;n cl&aacute;sicos de los modelos lineales para los par&aacute;metros del modelo; en otro,<SUP>7</SUP> calculando las medidas usuales de sensibilidad y especificidad y las estimaciones puntuales del riesgo relativo; y en otro,<SUP>8</SUP> calculando intervalos de confianza observados y esperados de &eacute;xito seg&uacute;n categor&iacute;as de la probabilidad estimada.      <P>El presente trabajo se propone exponer y discutir, a grandes rasgos, las propiedades y el significado de las curvas ROC y de varios de sus par&aacute;metros asociados y argumentar las ventajas que se derivan de su aplicaci&oacute;n. <H4> METODOS</H4> <B>NOTACION</B>      <P>En lo sucesivo E y F designan los pron&oacute;sticos de &eacute;xito y fracaso, respectivamente, para un estudiante cualquiera, mientras que <FONT FACE=Symbol>e </FONT>y <I>f</I> representan el resultado de &eacute;xito o fracaso que alcanz&oacute; finalmente dicho estudiante. La definici&oacute;n operacional de lo que constituye &eacute;xito y fracaso en un resultado acad&eacute;mico se da en trabajos previos.<SUP>6,7</SUP>      <P>p (E/<FONT FACE=Symbol>e</FONT>): probabilidad de verdadero negativo (de pronosticar &eacute;xito a un estudiante que finalmente tiene &eacute;xito).     <BR>p (E/<I>f</I>): probabilidad de falso negativo (de pronosticar &eacute;xito a un estudiante que a la postre fracasa).     <BR>p (F/<I>f</I>): probabilidad de verdadero positivo (de pronosticar fracaso a un estudiante que al final fracasa).     <BR>p (F/<FONT FACE=Symbol>e</FONT> ): probabilidad de falso positivo (de pronosticar fracaso a un estudiante que finalmente tiene &eacute;xito).      ]]></body>
<body><![CDATA[<P><B>LA CURVA ROC</B>      <P>La curva ROC para un predictor cualquiera del rendimiento es el gr&aacute;fico de los valores de p (F/<I>f</I>) contra (F/_) para varios puntos de corte c<SUB>o</SUB>, c<SUB>1</SUB>,...,c<SUB>k</SUB> del predictor en cuesti&oacute;n. El cociente entre estas 2 probabilidades en un punto cualquiera sobre la curva, es el llamado <I>cociente de las verosimilitudes</I>. Cada punto sobre la curva reconstruye completamente una tabla de contingencia 2 x 2 como la que representa la tabla 1, ya que las otras 2 probabilidades que completan la tabla, son el complemento con respecto a la unidad de las que muestra la curva. En efecto:      <P>p (E/<FONT FACE=Symbol>e</FONT> ) = 1 - p (F/<I>f</I>)      <P>p (E/<FONT FACE=Symbol>e</FONT> ) = 1 - p (F/<FONT FACE=Symbol>e</FONT> )      <P>Un predictor es mejor cuanto m&aacute;s se separe de la recta p(F/<I>f</I>) = p(F/<FONT FACE=Symbol>e</FONT>), es decir, cuanto mayor sea el &aacute;rea comprendida entre su curva ROC y aquella recta que representa el resultado de una clasificaci&oacute;n aleatoria.      <P>Es importante subrayar que la curva ROC resume toda la informaci&oacute;n contenida en las tablas 2 x 2 que originan todos los puntos de corte, y que, por esta raz&oacute;n, es mucho m&aacute;s informativa que las medidas usuales de efectividad como la sensibilidad, la especificidad o el riesgo relativo, que se refieren s&oacute;lo a un punto de corte, supuestamente &oacute;ptimo.      <P>La tabla muestra los valores de p (F/<I>f</I>) y p(F/<FONT FACE=Symbol>e</FONT>) correspondientes a varios puntos de corte, para los predictores &iacute;ndice acad&eacute;mico (IA) y prueba de ortograf&iacute;a (ORTO) obtenidos a partir de la matr&iacute;cula y los resultados de un curso acad&eacute;mico en el ICBP "Victoria de Gir&oacute;n". En los gr&aacute;ficos 1 y 2 aparecen las curvas ROC correspondientes a estos 2 predictores. En ellas se aprecia claramente la superioridad del &iacute;ndice acad&eacute;mico.      <P>TABLA 2. <I>Probabilidad de falsos positivos y verdaderos positivos para varios puntos de corte de los predictores IA y ORTO</I>     <CENTER><TABLE BORDER=0 CELLPADDING=5 > <TR> <TD VALIGN=TOP WIDTH="20%">Puntos&nbsp;</TD>  <TD VALIGN=TOP COLSPAN="2" WIDTH="40%">     <CENTER>IA</CENTER> </TD>  <TD VALIGN=TOP COLSPAN="2" WIDTH="40%">     ]]></body>
<body><![CDATA[<CENTER>ORTO</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">de corte&nbsp;</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>p(F/<FONT FACE=Symbol>e</FONT>)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>p(F/<I>f</I>)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>p(F/<FONT FACE=Symbol>e</FONT>)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>p(F/<I>f</I>)</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">1</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,04</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,10</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,05</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,09</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">2</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,13</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     ]]></body>
<body><![CDATA[<CENTER>,27</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,41</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,52</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">3</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,20</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,36</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,49</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,59</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">4</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,42</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,69</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,59</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     ]]></body>
<body><![CDATA[<CENTER>,70</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">5</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,70</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,91</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,67</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,77</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">6</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,87</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,98</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,76</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,83</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="20%">7</TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,96</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     ]]></body>
<body><![CDATA[<CENTER>,99</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,88</CENTER> </TD>  <TD VALIGN=TOP WIDTH="20%">     <CENTER>,94</CENTER> </TD> </TR> </TABLE></CENTER> <B>LAS MEDIDAS DE DETECTABILIDAD</B>      <P>Se han propuesto diversas medidas, llamadas "de detectabilidad" para caracterizar completamente a una curva ROC, sin referirse a ning&uacute;n punto de corte en particular.      <P>Entre ellas se encuentran:      <P>a) d = | Z (F/<I>f</I>) - Z(F/<FONT FACE=Symbol>e</FONT>) | en donde:      <P>Z(F/<I>f</I>) =<FONT FACE=Symbol>f</FONT> <SUP>-1</SUP> {p(F/<I>f</I>)}      <P>Z(F/_) =<FONT FACE=Symbol>f</FONT> <SUP>-1</SUP> {p(F/<FONT FACE=Symbol>e</FONT>)}      <P>y<FONT FACE=Symbol> f</FONT><SUP>-1</SUP> es la transformaci&oacute;n normal inversa.      <P>Es posible demostrar (anexo) que si el predictor X se distribuye normalmente y con la misma varianza en "<FONT FACE=Symbol>e</FONT>" y en "<I>f</I>", los puntos      ]]></body>
<body><![CDATA[<P>{Z<I><SUB>i</SUB></I>(F/<I>f</I>); Z<I><SUB>i</SUB></I>(F/<FONT FACE=Symbol>e</FONT>)}<SUB>o#<I>i</I>#k</SUB>      <P>describen una l&iacute;nea recta con pendiente 1 y ...     <PRE>d = <U>m</U><FONT FACE=Symbol>e</FONT><U> - m<I><SUB>f</SUB></I> </U>en donde:&nbsp; <FONT FACE=Symbol>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; s</FONT></PRE>  <DIR>m<I><SUB>f</SUB></I>: media del predictor en los estudiantes que fracasaron.      <P>m<FONT FACE=Symbol>e</FONT>: media del predictor en los estudiantes con &eacute;xito.</DIR> <FONT FACE=Symbol>s</FONT>: desv&iacute;o est&aacute;ndar com&uacute;n a ambos grupos.      <P>Cuando las varianzas son iguales, ocurre, como ya se ha expresado, que:      <P>Z<I><SUB>i</SUB></I>(F/<I>f</I>) = a + Z<I><SUB>i</SUB></I>(F/<FONT FACE=Symbol>e</FONT>) (puesto que la pendiente es 1) de suerte que...      <P><U>d</U> es constante e igual al intercepto de la recta, por lo que puede calcularse para un punto de corte c<I><SUB>i</SUB></I> arbitrario.      <P>Si las varianzas son desiguales, la pendiente b<FONT FACE=Symbol> &sup1; </FONT>1 y <U>d</U> no es constante a lo largo de la curva, por lo que se necesitan otras medidas de detectabilidad, entre las cuales se cuentan:      <P>b) <FONT FACE=Symbol>D</FONT>(<FONT FACE=Symbol>d</FONT>m,s), que proporciona 2 par&aacute;metros de la curva ROC que se definen del modo siguiente:      <P><U>s</U> es la pendiente de la curva (se demuestra que s =<FONT FACE=Symbol> se</FONT>/<FONT FACE=Symbol>s</FONT><I><SUB>f</SUB></I> en donde <FONT FACE=Symbol>se</FONT> y <FONT FACE=Symbol>s</FONT><I><SUB>f</SUB></I> son las desviaciones est&aacute;ndar del predictor en los estudiantes con &eacute;xito y con fracaso, respectivamente).     ]]></body>
<body><![CDATA[<PRE>&nbsp;&nbsp;&nbsp;&nbsp; <U>m<FONT FACE=Symbol>e</FONT> - m<I><SUB>f</SUB></I>&nbsp; </U><FONT FACE=Symbol>d</FONT>m = s<FONT FACE=Symbol>e</FONT></PRE>       <P>(Puede demostrarse igualmente que <FONT FACE=Symbol>d</FONT>m = d en el punto de corte para el cual Z(F/<I>f</I>) = 0).      <P>dm y s pueden obtenerse tanto gr&aacute;fica como anal&iacute;ticamente.      <P>c) d<SUB>e</SUB>, que se define como el valor de <U>d</U> en el punto, en escala inversa normal, para el cual p(F/<I>f</I>) + p(F/<FONT FACE=Symbol>e</FONT>)= 1      <P>Puede demostrarse que:     <PRE>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; m<FONT FACE=Symbol>e</FONT> - m<I><SUB>f</SUB></I>&nbsp; d<SUB>e</SUB>= 2---------&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; y por &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <FONT FACE=Symbol>se</FONT> + <FONT FACE=Symbol>s</FONT><I><SUB>f</SUB></I></PRE>       <P>tanto     <PRE>&nbsp;&nbsp; m<FONT FACE=Symbol>e</FONT> - m<I><SUB>f</SUB></I>&nbsp; d<SUB>e</SUB>=-------&nbsp; si <FONT FACE=Symbol>se</FONT> = <FONT FACE=Symbol>s</FONT><I><SUB>f</SUB></I> = <FONT FACE=Symbol>s</FONT>&nbsp; <FONT FACE=Symbol>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; s</FONT></PRE>       <P>d) A<SUB>z</SUB>, que se define como el &aacute;rea bajo la curva ROC. Es f&aacute;cil ver que A<SUB>z</SUB> var&iacute;a entre 0,5 en el caso de detectabilidad nula (el &aacute;rea debajo de la recta p(F/<I>f</I>) = p(F/<FONT FACE=Symbol>e</FONT>), y 1 en el caso de detectabilidad absoluta, es decir p(F/<I>f</I>) = 1 y p(F/<FONT FACE=Symbol>e</FONT>) = 0 cualquiera sea el punto de corte.      <P>Para distribuciones normales, A<SUB>z</SUB> es el &aacute;rea bajo la curva normal est&aacute;ndar hasta el punto Z<SUB>A</SUB> que puede obtenerse anal&iacute;ticamente, y tambi&eacute;n a partir de la curva ROC, expresada en la escala normal inversa.<SUP>9</SUP>      ]]></body>
<body><![CDATA[<P>Puede demostrarse (anexo) que     <BR>&nbsp;     <PRE>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; m<FONT FACE=Symbol>e</FONT> - m<I><SUB>f</SUB></I>&nbsp; Z<SUB>A</SUB> = --<U>--------- </U>&nbsp;&nbsp;&nbsp;&nbsp; \/<FONT FACE=Symbol>s</FONT><SUP>2</SUP><FONT FACE=Symbol>e</FONT> + <FONT FACE=Symbol>s</FONT><SUP>2</SUP><I><SUB>f</SUB></I></PRE>       <P>Gr&aacute;ficamente, Z<SUB>A</SUB> puede obtenerse como la distancia perpendicular a la curva ROC, expresada en unidades de desviaci&oacute;n normal, desde el origen de coordenadas.      <P>Algunos autores proponen calcular d<SUB>A</SUB> = \/ 2 Z<SUB>A</SUB> cuyo rango de variaci&oacute;n lo hace comparable con d y d<SUB>e</SUB>.      <P><B>UN ALGORITMO PARA LA VALIDACION DE LOS PREDICTORES</B>      <P>Se describe a continuaci&oacute;n una sucesi&oacute;n de pasos, que definen un algoritmo para la construcci&oacute;n y ulterior an&aacute;lisis de las curvas ROC, en su aplicaci&oacute;n para la validaci&oacute;n de predictores del rendimiento: <DIR>1. Para distintos puntos de corte c<SUB>o</SUB>, c<SUB>1</SUB>,...,c<SUB>k</SUB> se calculan      <P>{p<I><SUB>i</SUB></I> (F/<FONT FACE=Symbol>e</FONT>), p<I><SUB>i</SUB></I> (F/<I>f</I>)}<SUB>o<FONT FACE=Symbol>&pound;</FONT>i<FONT FACE=Symbol>&pound;</FONT>k</SUB>      <P>2. A partir de estos puntos se construye as&iacute; la curva ROC.      <P>3. Se lleva a cabo la transformaci&oacute;n a unidades de desviaci&oacute;n normal est&aacute;ndar:</DIR> p<I><SUB>i</SUB></I> (F/<FONT FACE=Symbol>e</FONT>) <FONT FACE=Symbol>&THORN;</FONT> Z<I><SUB>i</SUB></I> (F/<FONT FACE=Symbol>e</FONT>)      ]]></body>
<body><![CDATA[<P>p<I><SUB>i</SUB></I> (F/<I>f</I>) <FONT FACE=Symbol>&THORN; </FONT>Z<I><SUB>i</SUB></I> (F/<I>f</I>) <DIR>4. Se obtiene la recta m&iacute;nimo-cuadr&aacute;tica</DIR> Z<I><SUB>i</SUB></I> (F/<I>f</I>) = a + b Z<I><SUB>i</SUB></I> (F/<FONT FACE=Symbol>e</FONT>) que corresponde al modelo de regresi&oacute;n lineal simple      <P>Z<I><SUB>i</SUB></I> (F/<I>f</I>) = <FONT FACE=Symbol>a</FONT> + <FONT FACE=Symbol>b</FONT> Z<I><SUB>i</SUB></I> (F/<FONT FACE=Symbol>e</FONT>) + <FONT FACE=Symbol>e</FONT><I><SUB>i</SUB></I> y se verifica su buen ajuste por los m&eacute;todos convencionales. Se resuelve adem&aacute;s el problema de prueba de hip&oacute;tesis.      <P>H<SUB>o</SUB>: <FONT FACE=Symbol>b</FONT> = 1 vs. H<SUB>A</SUB>: <FONT FACE=Symbol>b</FONT> <FONT FACE=Symbol>…&sup1;</FONT> 1 <DIR>5. Si no puede rechazarse la hip&oacute;tesis H<SUB>o</SUB>, se obtiene directamente <U>d</U> (obs&eacute;rvese que en ese caso d = a).      <P>6. Si se rechaza H<SUB>o</SUB>, entonces debe calcularse alguna de las medidas de detectabilidad expuestas anteriormente. (Swets et al.<SUP>10</SUP> consideran a A<SUB>z</SUB> la mejor de estas medidas).</DIR> En la tabla 3 se exponen los resultados del ajuste de la recta m&iacute;nimo-cuadr&aacute;tica descrito en el paso 4 de este algoritmo, y en la tabla 4, los valores de las distintas medidas de detectabilidad para ambos predictores sobre la base de los resultados obtenidos durante el curso 88-89.     <CENTER>TABLA 3. <I>Par&aacute;metros de la recta Z(F/f) = a+b Z(F/</I><FONT FACE=Symbol><SUB>e</SUB> </FONT><I>) para los predictores IA y ORTO</I></CENTER>      <CENTER><TABLE BORDER=0 CELLPADDING=5 > <TR> <TD VALIGN=TOP WIDTH="33%">Predictor</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>F (del buen ajuste)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>t (para H<SUB>o</SUB>:<FONT FACE=Symbol>b</FONT> = 1)</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">IA&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>446,350</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>2,13</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     ]]></body>
<body><![CDATA[<CENTER>(p=,000)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>(p<FONT FACE=Symbol>&pound;</FONT>0,5)</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">ORTO&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>2860,320</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>1,52</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="33%">&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>(p=,000)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>(ns)</CENTER> </TD> </TR> </TABLE></CENTER>      <CENTER>TABLA 4. <I>Medidas de detectabilidad para las curvas ROC de los predictores IA y ORTO</I></CENTER>      <CENTER><TABLE BORDER=0 CELLPADDING=5 > <TR> <TD VALIGN=TOP WIDTH="31%">Medidas de detectabilidad&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>IA</CENTER> </TD>  <TD VALIGN=TOP WIDTH="36%">     <CENTER>ORTO</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="31%">d -&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     ]]></body>
<body><![CDATA[<CENTER>-</CENTER> </TD>  <TD VALIGN=TOP WIDTH="36%">     <CENTER>0,28</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="31%"><FONT FACE=Symbol>D</FONT> (<FONT FACE=Symbol>d</FONT><SUB>m</SUB> ,s)&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>(0,61;1,02)</CENTER> </TD>  <TD VALIGN=TOP WIDTH="36%">     <CENTER>(0,28;0,91)</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="31%">d<FONT FACE=Symbol><SUB>e</SUB>&nbsp;</FONT></TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>0,62</CENTER> </TD>  <TD VALIGN=TOP WIDTH="36%">     <CENTER>0,26</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="31%">A<SUB>z</SUB>&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>0,67</CENTER> </TD>  <TD VALIGN=TOP WIDTH="36%">     <CENTER>0,58</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="31%">Z<SUB>A</SUB>&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     <CENTER>0,44</CENTER> </TD>  <TD VALIGN=TOP WIDTH="36%">     <CENTER>0,19</CENTER> </TD> </TR>  <TR> <TD VALIGN=TOP WIDTH="31%">d<SUB>A</SUB>&nbsp;</TD>  <TD VALIGN=TOP WIDTH="33%">     ]]></body>
<body><![CDATA[<CENTER>0,62</CENTER> </TD>  <TD VALIGN=TOP WIDTH="36%">     <CENTER>0,26</CENTER> </TD> </TR> </TABLE></CENTER>  <H4> DISCUSION</H4> Este trabajo introduce el uso de las curvas ROC a una nueva &aacute;rea de aplicaci&oacute;n: la predicci&oacute;n del rendimiento docente. La mayor utilidad que puede tener este instrumento se relaciona con la posibilidad de comparar varios predictores a todo lo largo de su recorrido, y no s&oacute;lo en torno a un punto de corte que supuestamente da lugar a la condici&oacute;n de m&aacute;xima u &oacute;ptima discriminaci&oacute;n del predictor.      <P>La arbitrariedad en la elecci&oacute;n <I>a posteriori</I> de un punto de corte que minimice alguna funci&oacute;n de la clasificaci&oacute;n err&oacute;nea (por falsa positividad y falsa negatividad) ha sido se&ntilde;alada y ampliamente discutida en un trabajo anterior.<SUP>11</SUP>      <P>Cuando se utilizan las curvas ROC no hay necesidad de circunscribirse a la elecci&oacute;n de un punto de corte arbitrario. En el pron&oacute;stico del rendimiento, este hecho es de gran importancia: cuando se desea comparar varios predictores del rendimiento seg&uacute;n su comportamiento en un curso acad&eacute;mico cualquiera, la comparaci&oacute;n se lleva a cabo de ordinario sobre la base de la especificidad, la sensibilidad, los valores predictivos y el riesgo relativo, que se asocian a puntos de corte encontrados en un curso anterior. Este procedimiento, que por supuesto, no es privativo de la predicci&oacute;n del rendimiento, sino que es pr&aacute;ctica com&uacute;n en la validaci&oacute;n y comparaci&oacute;n de un conjunto de criterios diagn&oacute;sticos o pron&oacute;sticos, puede dar una imagen distorsionada de la relevancia relativa de los predictores, porque el punto de corte &oacute;ptimo puede variar en el tiempo.      <P>La reducci&oacute;n de la curva ROC a un &uacute;nico par&aacute;metro que describa su comportamiento, no est&aacute; exenta del riesgo anterior. Esta es la raz&oacute;n de mayor fuerza para proponer como medida de detectabilidad a A<SUB>z</SUB> que mide el &aacute;rea completa bajo la curva, mejor que dm o d<SUB>e</SUB>, que seleccionan s&oacute;lo un punto de la curva.      <P>Como se observa en la tabla 3, el modelo lineal representa adecuadamente la relaci&oacute;n entre Z(F/<I>f</I>) y Z(F/<FONT FACE=Symbol><SUB>e</SUB> </FONT>) para ambos predictores, pero s&oacute;lo para ORTO la pendiente es igual a 1. De aqu&iacute; se deduce que para comparar a ambos predictores no puede utilizarse a <U>d</U> como medida de detectabilidad, ya que &eacute;sta s&oacute;lo tiene sentido para uno de ellos.      <P>Cualquiera de las medidas de detectabilidad apropiadas, aplicadas a la evaluaci&oacute;n comparativa de IA y ORTO muestra la superioridad del primero como predictor del rendimiento y confirma lo que se observa claramente en las figuras 1 y 2: la curva ROC de IA limita un &aacute;rea mayor con respecto al eje de las abscisas que la que corresponde a ORTO. <H4> SUMMARY</H4> The well-know ROC curves (relative operating characteristic) and their associated detectability measures, are introdced for the validation of several predictors of the academic achievement. Emphasis is made on the advantages of this instrument over other know classic measures, as sensitivity and specificity, to compare the effectiveness of several variables with prognostic purposes. Several results related with the foundation, interpretation and expressions for calculating the different detectability measures, are exposed, and the application of these measures is illustrated, to show the advantages of the academic index over the orthography tests in the prognostic of the educational achievement in the superior medical education.      <P><I>Key words:</I> ACHIEVEMENT; ROC CURVES. <H4> REFERENCIAS BIBLIOGRAFICAS</H4>  <OL>     <!-- ref --><LI> Swets JA. The relative operating characteristics in psychology. Science 1973;182:990-1000.</LI>      <!-- ref --><LI> Lusted LB. Signal detectability and medical decision-making. Science 1971;171:1217-9.</LI>      <!-- ref --><LI> Swets JA. ROC analysis applied to the evaluation of medical imaging techniques. Invest Radiol 1979;14:109-21.</LI>      <!-- ref --><LI> McNeil BJ, Adelstein SJ. Determining the value of diagnostic and screening tests. J Nucl Med 1976;17:439-48.</LI>      <!-- ref --><LI> Erdreich LS, Lee ET. Use of relative operating characteristic analysis in Epidemiology. Am J Epidemiol 1981;114:649-62.</LI>      <!-- ref --><LI> Bacallao J, Aneiros R, Rodr&iacute;guez E, Romillo MD. Pron&oacute;stico y evoluci&oacute;n del rendimiento acad&eacute;mico en un ensayo pedag&oacute;gico controlado. Educ Med Sup 1992;2:91-9.</LI>      <!-- ref --><LI> Bacallao J, Valenti J, Rodr&iacute;guez E, Romillo MD. Un enfoque bayesiano no param&eacute;trico del pron&oacute;stico del rendimiento acad&eacute;mico. Educ Med Sup 1991;1:29-37.</LI>      <!-- ref --><LI> Bacallao J, Ant&oacute;n M, Rodr&iacute;guez E. La validaci&oacute;n del pron&oacute;stico del rendimiento en un centro de ense&ntilde;anza m&eacute;dica superior. Educ Med Sup 1991;2:75-82.</LI>      <!-- ref --><LI> Simpson AJ, Fitter MJ. What is the best index of detectability? Psychol Bull 1973;80:481-8.</LI>      <!-- ref --><LI> Swets JA, et al. Assessment of diagnostic technologies. Science 1979;205:753-9.</LI>      <!-- ref --><LI> Bacallao J. Un procedimiento estad&iacute;stico para la validaci&oacute;n de los modelos de predicci&oacute;n. Rev Cubana Cienc Matemat 1987;5:113-9.</LI>      <!-- ref --><LI> Fuller G. Analytic geometry. Boston: Addison-Wesley, 1956.</LI>     </OL> Recibido: 1 de diciembre de 1995. Aprobado: 22 de diciembre de 1995.     <BR> Lic. Jorge Bacallao Gallestey. Instituto Superior de Ciencias B&aacute;sicas y  Precl&iacute;nicas "Victoria de Gir&oacute;n". Ciudad de La Habana, Cuba.       ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Swets]]></surname>
<given-names><![CDATA[JA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The relative operating characteristics in psychology]]></article-title>
<source><![CDATA[Science]]></source>
<year>1973</year>
<volume>182</volume>
<page-range>990-1000</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lusted]]></surname>
<given-names><![CDATA[LB]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Signal detectability and medical decision-making]]></article-title>
<source><![CDATA[Science]]></source>
<year>1971</year>
<volume>171</volume>
<page-range>1217-9</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Swets]]></surname>
<given-names><![CDATA[JA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[ROC analysis applied to the evaluation of medical imaging techniques]]></article-title>
<source><![CDATA[Invest Radiol]]></source>
<year>1979</year>
<volume>14</volume>
<page-range>109-21</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McNeil]]></surname>
<given-names><![CDATA[BJ]]></given-names>
</name>
<name>
<surname><![CDATA[Adelstein]]></surname>
<given-names><![CDATA[SJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Determining the value of diagnostic and screening tests]]></article-title>
<source><![CDATA[J Nucl Med]]></source>
<year>1976</year>
<volume>17</volume>
<page-range>439-48</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Erdreich]]></surname>
<given-names><![CDATA[LS]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[ET]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Use of relative operating characteristic analysis in Epidemiology]]></article-title>
<source><![CDATA[Am J Epidemiol]]></source>
<year>1981</year>
<volume>114</volume>
<page-range>649-62</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bacallao]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Aneiros]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Rodríguez]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Romillo]]></surname>
<given-names><![CDATA[MD]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Pronóstico y evolución del rendimiento académico en un ensayo pedagógico controlado]]></article-title>
<source><![CDATA[Educ Med Sup]]></source>
<year>1992</year>
<volume>2</volume>
<page-range>91-9</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bacallao]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Valenti]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Rodríguez]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Romillo]]></surname>
<given-names><![CDATA[MD]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Un enfoque bayesiano no paramétrico del pronóstico del rendimiento académico]]></article-title>
<source><![CDATA[Educ Med Sup]]></source>
<year>1991</year>
<volume>1</volume>
<page-range>29-37</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bacallao]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Antón]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Rodríguez]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[La validación del pronóstico del rendimiento en un centro de enseñanza médica superior]]></article-title>
<source><![CDATA[Educ Med Sup]]></source>
<year>1991</year>
<volume>2</volume>
<page-range>75-82</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Simpson]]></surname>
<given-names><![CDATA[AJ]]></given-names>
</name>
<name>
<surname><![CDATA[Fitter]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[What is the best index of detectability]]></article-title>
<source><![CDATA[Psychol Bull]]></source>
<year>1973</year>
<volume>80</volume>
<page-range>481-8</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Swets]]></surname>
<given-names><![CDATA[JA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessment of diagnostic technologies]]></article-title>
<source><![CDATA[Science]]></source>
<year>1979</year>
<volume>205</volume>
<page-range>753-9</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bacallao]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Un procedimiento estadístico para la validación de los modelos de predicción]]></article-title>
<source><![CDATA[Rev Cubana Cienc Matemat]]></source>
<year>1987</year>
<volume>5</volume>
<page-range>113-9</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fuller]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[Analytic geometry]]></source>
<year>1956</year>
<publisher-loc><![CDATA[Boston ]]></publisher-loc>
<publisher-name><![CDATA[Addison-Wesley]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
