Meu SciELO
Serviços Personalizados
Artigo
Indicadores
- Citado por SciELO
Links relacionados
- Similares em SciELO
Compartilhar
Revista Cubana de Informática Médica
versão On-line ISSN 1684-1859
RCIM vol.3 no.2 Ciudad de la Habana jul.-dez. 2011
TRABAJO ORIGINAL
Riesgo relativo, sensibilidad y especificidad: un enfoque desde el análisis matemático y el álgebra lineal
Relative risk, sensitivity, specificity: an approach from mathematical analysis and linear algebra
Rafael Ávila Ávila,I Maria del Carmen Expósito GallardoII
ILicenciado. Grupo de Aplicaciones Nucleares. Centro de Investigaciones y Servicios Ambientales y Tecnológicos de Holguín (CISAT). CITMA. E-mail: chino@citmahlg.holguin.inf.cu
IILicenciada. Universidad Médica de Holguín Mariana Grajales Coello.
RESUMEN
El riesgo relativo (RR), la razón de productos cruzados (OR), la especificidad (E) y la sensibilidad (S) constituyen medidas de resumen para variables cualitativas de interés en Medicina. Se presenta el RR como una función continua de dos variables y se analiza la condición para la cual este se aproxima a la OR a partir de su desarrollo en serie de potencias. La sensibilidad, la especificidad y los valores predictivos (VPP y VPN) se analizan como funciones continuas de una variable en todo su dominio, con un comportamiento asintótico característico. A partir del estudio de un sistema de ecuaciones lineales homogéneo se deduce una ecuación general que vincula S, E, VPP y VPN y se discuten diferentes casos de interés.
Palabras clave: Sensibilidad, especificidad, riesgo relativo, razón de momios, series de potencia, sistema de ecuaciones lineales.
ABSTRACT
The relative risk (RR), the odds ratio (OR), the specificity (E) and the sensitivity (S) are measures for qualitative variables of medical interest in Medicine. It is analysed the RR as a continue function of two variables as well as the conditions by which it is approximated to the OR by means of a power series expansion. It is analysed too the sensitivity, the specificity and the predictive values as continue functions of one variable in all its domains of definition as well as the asymptotic behaviour of these functions. It is discussed different interesting cases by means of a system of linear equations in S, E, VPP, VPN.
Key words: Sensitivity, specificity, relative risk, odds ratio, power series, linear system of equations.
INTRODUCCIÓN
El riesgo en un término empleado en diversos contextos. En Protección Radiológica, se considera como una magnitud multiatributiva con la que se expresa el peligro o la posibilidad de consecuencias nocivas o perjudiciales ante ciertas condiciones y que guarda relación con la probabilidad de determinadas consecuencias dañinas y la amplitud y el carácter de tales consecuencias.1 Si se trata de estimar los riesgos de la exposición a las radiaciones a dosis bajas, el Comité Científico de las Naciones Unidas para el Estudio de los Efectos de las Radiaciones Ionizantes considera, entre las estimaciones radiobiológicas, la probabilidad de un exceso de enfermedades malignas del orden de 0.0001 por año.2
En otros ámbitos la referencia al riesgo expresa la posibilidad de pérdida de la vida o daño a las personas, de modo que si se trata de riesgo individual se enfatiza en la probabilidad de daño de cada individuo expuesto.3
En las definiciones referidas, la alusión a la probabilidad es directa, cuestión que no está ausente en la esfera de las ciencias médicas. En la Epidemiología el riesgo es de uso frecuente para evaluar la posibilidad de que los sujetos tengan una condición específica en presencia de determinados atributos. Es por tal razón que algunos autores lo consideran como una medida cuantitativa epidemiológica de la posibilidad de que el sujeto adquiera tal condición dado que tiene el atributo particular bajo consideración. Este atributo representa el factor de riesgo mientras que el riesgo mide la probabilidad de incidencia de la condición.4,5
La investigación en un estadio descriptivo de la posible relación entre la exposición a un factor de riesgo y la aparición de un evento o enfermedad puede enfocarse a partir del análisis e interpretación del riesgo relativo RR y la razón de productos cruzados OR (Odds ratio, razón de momios). Esta última ofrece un estimado del primero cuando las enfermedades son poco frecuentes de manera que la proporción de sujetos con la condición es baja mientras que para eventos comunes ambas medidas pueden tener valores muy distintos, siempre y cuando ambas puedan calcularse en el tipo de estudio considerado.
No obstante, de las expresiones algebraicas usuales para el cálculo de tales medidas no se deducen con claridad otras expresiones que posibiliten la realización de las estimaciones pertinentes y de ahí la utilidad de abundar en las relaciones matemáticas entre dichas medidas así como las condiciones bajo las cuales ellas se aproximan.
Por otra parte, la especificidad y la sensibilidad son medidas útiles para hacer referencia a la eficacia, validez o exactitud de las diversas pruebas diagnósticas. La interpretación de los resultados de tales pruebas se puede facilitar partiendo del conocimiento de los valores predictivos de manera que, el establecimiento de relaciones matemáticas entre estas medidas puede constituir una herramienta de interés en el análisis de ciertos casos como la presencia de enfermedades con frecuencias no altas.
DESARROLLO
Riesgo relativo y razón de productos cruzados
El riesgo relativo (RR) y la odds ratio (OR) constituyen dos razones de interés cuando se necesita ofrecer una magnitud de la relación entre las medidas nominales asociadas a estudios que implican la medición de riesgos de un resultado dado en relación si está presente o no un factor predisponente.6
El RR, o razón del riesgo de una enfermedad, se calcula mediante el cociente entre la incidencia de personas expuestas y la incidencia en personas no expuestas al factor; se utiliza en los estudios de cohorte. Por su parte la OR se puede calcular tanto en estudios de caso control y como en los prospectivos a partir del cociente entre los momios, odds o ventajas del éxito,7 una vez que se han identificado las variables dicotómicas estado de salud (enfermo, no enfermo) y exposición al factor de riesgo (si, no) y los datos se disponen adecuadamente en una tabla de doble entrada.6,7
Sean:
a: cantidad de personas enfermas en presencia del factor de riesgo; b: cantidad de personas no enfermas expuestas al factor de riesgo; c: cantidad de personas enfermas no expuestas al factor de riesgo; d: cantidad de personas no enfermas en las que el factor de riesgo no está presente.
P1: probabilidad de padecer la enfermedad en presencia del factor de riesgo (probabilidad de que ocurra el evento o proporción en que este tiene lugar).
Q1: probabilidad de no estar enfermo (estar sano) en presencia del factor de riesgo (probabilidad de que no ocurra dicho evento o proporción en que no ocurre)
P2: probabilidad de estar enfermo en ausencia del factor de riesgo (probabilidad de que ocurra el evento o proporción en que este tiene lugar).
Q2: probabilidad de no estar enfermo (estar sano) en ausencia del factor de riesgo (probabilidad de que no ocurra dicho evento o proporción en que no ocurre)
Dado que el momio se define como la razón entre la probabilidad de que ocurra el evento y la probabilidad de que no ocurra dicho evento, la odds ratio la razón entre momios y el RR el cociente entre el riesgo de sufrir un determinado evento en el grupo expuesto a un factor de riesgo dado y el riesgo de sufrir dicho evento en el grupo de los no expuestos a idéntico factor de riesgo, se tiene que:
No es difícil demostrar que:
Al realizar algunas transformaciones algebraicas, el riesgo relativo se puede representar en la forma:
donde: x=c/d y y=a/b. Así, se puede analizar dicho riesgo como una función de dos variables x e y con dominios: y
Para patologías poco frecuentes, los enfermos en presencia del factor de riesgo son mucho menores que los no enfermos (a<<b) en presencia del mismo factor y de igual forma la cantidad de aquejados de la enfermedad es mucho menor que la cantidad de no enfermos (c<<d) en ausencia del propio factor. Por tanto: x<<1 e y<<1.
El desarrollo en serie de potencias de una función de dos variables F(x,y) alrededor del punto (x,y)=(0,0)8 está dado por la expresión general:
Si se limita el desarrollo hasta los términos del primer orden resulta:
De manera que la función RR(x,y) desarrollada en serie de Taylor hasta el primer término adopta la forma:
Si la enfermedad es de baja frecuencia, dado que la cantidad de sujetos con la condición es también baja, a<<b, por lo que el término y=a/b se puede despreciar y se concluye que en estos casos RROR, o sea al cumplirse tal condición, el riesgo relativo se puede aproximar por la razón de productos cruzados, resultados que coincide con el obtenido en.4
Sensibilidad y especificidad
En estas medidas, las variables cualitativas involucradas son estado de salud (enfermo, sano) y resultado de la prueba diagnóstica (positivo, negativo). La clasificación de una cantidad determinada de personas (N) de acuerdo a los resultados de la aplicación de la prueba diagnóstica y su estado de salud, permite obtener expresiones para la sensibilidad y especificidad a partir de las siguientes definiciones.
Sensibilidad (S): proporción de enfermos que son bien clasificados (VP); esto es la proporción de verdaderos positivos respecto al total igual a la suma de los verdaderos positivos (VP) y falsos negativos (FN):
Especificidad (E): proporción de sanos bien clasificados (VN) como resultado de la prueba, es decir la proporción de verdaderos negativos respecto al total integrado por la suma de los falsos positivos (FP) y los verdaderos negativos (VN):
La sensibilidad, a partir de transformaciones algebraicas en la expresión que la define, puede representarse como una función de x=FN/VP y por tanto:
La función S(x) es continua en todo su campo de definición, monótona decreciente y en los extremos del intervalo alcanza los límites:
El desarrollo de una función F(x) de una variable, en serie de Taylor se puede escribir como:
Si se desarrolla la función S(x) hasta el primer término alrededor del punto x=0, de acuerdo a la expresión anterior, se obtiene:
Ello corresponde al caso en que FN tiende a cero (de manera que x también es pequeño) y coincide con la situación en que la proporción de verdaderos positivos o enfermos bien clasificados es casi la unidad o S(x)1, por lo que la sensibilidad es alta.
Razonamientos similares se pueden aplicar a la especificidad E, de manera que:
E(y) es también una función continua en todo su dominio y decrece monótonamente. Los valores límites en los extremos del intervalo son:
El desarrollo de la función E(y) en serie de potencias alrededor de y=0, tiene la forma:
Tal desarrollo de la función Especificidad hasta el primer orden es de tipo:
No es difícil obtener las siguientes expresiones para la especificidad en términos de la sensibilidad y de la variable x.
Las expresiones para el cálculo de los valores predictivos positivo y negativo son respectivamente:
Se pueden obtener expresiones semejantes para estos valores en forma de funciones continuas de las variables z y u y monótonas decrecientes:
Los límites son:
Los desarrollos en series de potencias alrededor de z=0 y u=0 son similares y hasta el segundo orden tienen la forma:
Todas las funciones S(x), E(y), VPP(z) y VPN(u) exhiben, según muestra el gráfico 1, un comportamiento similar F(v)=1/(1+v), que es del tipo lineal decreciente F(v)1-v para valores pequeños de la variable independiente, mientras que para valores grandes, el valor que adopta la función se acerca asintóticamente al eje de las abscisas, mostrando un comportamiento de tipo hiperbólico (1/v).
Tal comportamiento puede explicarse para la sensibilidad si se recuerda que x=FN/VP por lo que a medida que aumentan los falsos negativos y disminuyen los verdaderos positivos, la fracción se hace grande, el denominador de la función S(x) también crece y la función decrece rápidamente. En caso de tender la fracción x=FN/VP al valor cero, casi todas las personas a las cuales se les aplica la prueba diagnóstica, coinciden con los verdaderos positivos y apenas existirían falsos negativos, incrementándose la sensibilidad que en el límite adoptaría el valor 1, algo difícil de lograr en casos prácticos, ya que, aún en el caso de que todos los resultados fuesen positivos una vez realizada la prueba, ello no significaría presencia de la enfermedad en todas y cada una de las personas a las que se le aplicó, pues no existe certeza completa para diferenciar los individuos sanos de los enfermos.
Interpretaciones análogas se pueden hacer para las funciones E(y), VPP(z) y VPN(u) en términos de las variables y,z y u.
Relaciones entre la sensibilidad (S), especificidad (E) y los valores predictivos positivo (VPP) y negativo (VPN)
Combinando las expresiones para los valores predictivos positivo y negativo, la sensibilidad y la especificidad, se obtiene el siguiente sistema de cuatro ecuaciones lineales para las variables VP, VN, FP, FN:
El sistema anterior tiene la forma:
Dicho sistema homogéneo de cuatro ecuaciones con las cuatro incógnitas X1, X2, X3 y X4 tiene soluciones no triviales cuando su determinante se anula:9
Por tanto si se impone la condición anterior al sistema 1, se tiene que:
Desarrollando este determinante por la primera columna empleando el método de menores, se obtiene la siguiente ecuación general:
El miembro izquierdo de la ecuación anterior es el cociente de las denominadas razones de verosimilitud positiva y negativa dadas respectivamente por las expresiones siguientes:
Por consiguiente:
Análisis de ciertas soluciones de la ecuación anterior
a) Si S=1 o E=1, el miembro izquierdo es igual a cero por lo que la igualdad se satisface para los siguientes valores:
VPP=1 o VPN=1
Sea E(y)1 y S(x)=1; esto es porque: x=0, FN=0 y por tanto: u=0, VPN(u)=1 y VPP(z) puede tomar diferentes valores.
Sea S(x)1 y E(y)=1; esto es porque y=0, FP=0 y por tanto VPP(z)=1 y VPN(u) puede adoptar diferentes valores.
Se debe señalar que los casos en los que S=1 o E=1 son poco frecuentes por cuanto no existe una fiabilidad total para diferenciar los individuos enfermos de los no enfermos, dado que no siempre un resultado positivo después que se aplica una prueba diagnóstica quiere decir presencia de la enfermedad y un resultado negativo ausencia de la misma.10
b) Para S + E1, entonces:
c) S=E 1. En este caso se obtiene la ecuación siguiente:
La ecuación obtenida es del tipo , cuyas soluciones generales para el caso en que su discriminante sea mayor que cero tiene la forma:
Por tanto las soluciones para la Especificidad E son:
Sustituyendo en la expresión anterior, la correspondiente a f y considerando sólo el signo positivo delante del radical (se puede efectuar un análisis similar considerando el signo negativo delante del radical) se obtiene:
Una solución real y positiva es obtenida si son simultáneamente válidas las condiciones siguientes:
1) La expresión subradical es mayor que cero, lo cual se cumple siempre dado que:
2)
Esta desigualdad es válida si:
El cumplimiento de la condición anterior conduce a:
lo que garantiza el valor positivo del denominador y el carácter real de la solución obtenida para la especificidad (E).
CONCLUSIONES
El riesgo relativo puede presentarse como una función de dos variables cuyo desarrollo en serie de potencias de Taylor hasta el primer orden, escogidas convenientemente las variables x e y posibilita obtener como caso particular la expresión para el cálculo de la razón de productos cruzados.
La sensibilidad, la especificidad, el valor predictivo positivo y el valor predictivo negativo se pueden analizar como funciones continuas de una variable que tienen un desarrollo en serie similar y un comportamiento asintótico típicamente hiperbólico para valores de las variables independientes tendientes a infinito.
Las medidas E, S VPP y VPN no son independientes y están relacionadas entre sí por un polinomio de segundo grado en S, cuyas soluciones generales posibilitan el análisis de distintos casos de interés y las condiciones de validez para las expresiones deducidas.
REFERENCIAS BIBLIOGRÁFICAS
1. Organismo Internacional de Energía Atómica. Normas básicas internacionales de seguridad para la protección contra la radiación ionizante y para la seguridad de las fuentes de radiación. Viena: OIEA; 1997.
2. González AJ. Criterios Internacionales en Protección Radiológica. VII Congreso Nacional de Protección Radiológica. Maspalomas, Gran Canaria (España), 27-29 de septiembre; 2000.
3. Salomón Llanes J, Perdomo Ojeda M. Análisis de riesgo industrial. Caracas: Centro de Estudios Gerenciales ISID, Instituto Superior de Investigación y Desarrollo; 2001.
4. Mandeville PE. Tips bioestadísticos. Tema 14: razón de momios 1. Ciencia UANL, Universidad Autónoma de Nuevo León, abril-junio, 002; 2007. Disponible en: http://redalyc.uaemex.mx/pdf/402/40210219.pdf
5. Woodward M. Epidemiology: Study Design and Data Analysis. Text in Statistical Science. Chapman & Hall/CRC; 1999.
6. Dawson-Saunder B, Trapo RB. Bioestadística Médica. México D.F.: El Manual Moderno; 1993.
7. Torres Delgado JA, Bayarre Vea H. et al. Informática Médica. Tomo 2. Bioestadística. La Habana: Editorial Ciencias Médicas; 2004.
8. Kudriatsev LD. Curso de Análisis Matemático. Tomo 2. Moscú: Mir; 1984.
9. Ilyin BA, Pozniak EG. Geometría Analítica. Moscú: Nauka; 1981.
10. Bermejo Fraile B. Epidemiología clínica aplicada a la toma de decisiones en Medicina. Navarra (España): Gobierno de Navarra, Departamento de Salud; 2001.
Recibido: 13 de septiembre de 2011.
Aprobado: 7 de noviembre de 2011.