Introducción
La apendicitis aguda es considerada una de las causas más comunes de abdomen agudo quirúrgico.1,2 Su fisiopatología característica inicia con una obstrucción luminal la que permite el paso a la invasión bacteriana, la cual genera una diversidad de síntomas en el transcurso de su evolución. A pesar de que su diagnóstico es considerado un reto, es fundamentalmente clínico y con parámetros accesibles al médico tratante.3
La diversidad en sus manifestaciones clínicas he permitido agruparlas en forma de scores diagnósticos.3,4,5 A través de los años se han propuesto diferentes modelos de acuerdo con la población y recursos que consideraban cada uno de los autores.6,7 Entre los más conocidos están el score Fenyo,8 RIPASA,9 y Alvarado.10 También hay más recientes como el de Karaman,11 el de Benito, un score enfocado en la población pediátrica de bajo riesgo.12
El score de Alvarado o MANTRELS en inglés, fue uno de los primeros scores desarrollados, fue publicado en 1986. Se basó en estudios previos y optó por juntar 9 variables, entre la clínica y estudios de laboratorio, de los cuales uno se descartó por su baja asociación, que fue el tacto rectal, y quedó con sus 8 conocidas variables. A cada una de ellas se le otorgó un punto, excepto a la sensibilidad en el cuadrante inferior derecho y a la leucocitosis, por su alta fuerza de asociación, se les asignó 2 puntos, completándose así los 10 puntos del score. El punto de corte otorgado dentro de este estudio fue de 6 puntos inicialmente, pero también se concluyó que este valor puede cambiar al ser flexible y adaptarse a diferentes contextos.10
Si bien es cierto, el score de Alvarado es uno de los más utilizados en los entornos hospitalarios, utiliza criterios de laboratorio en su cálculo, aunque simple, puede ser una limitante para algunos escenarios de atención primaria.
Por lo anterior, el objetivo del estudio fue determinar la superioridad del nuevo score resultante frente al score de Alvarado en el diagnóstico de apendicitis aguda.
Métodos
Se realizó un estudio de pruebas diagnósticas, con el uso de la base de datos del Servicio de Cirugía del Hospital Regional Docente de Trujillo, entre febrero y diciembre del año 2015. La población de estudio la constituyeron los pacientes ingresados por emergencia con sospecha de apendicitis aguda entre 18 y 59 años de edad, con la historia clínica completa, operados y con reporte histopatológico. Los pacientes fueron elegidos por conveniencia y censal. Se excluyeron a todos los pacientes con obesidad mayor al tipo III, las embarazadas con hallazgos de peritonitis generalizada, o presencia de masa apendicular.
La base de datos mencionada corresponde a una línea de investigación del servicio de cirugía, en ella se registra a todos los pacientes ingresados por emergencia con sospecha de apendicitis aguda. Estos datos fueron recogidos por residentes de cirugía de guardia, para evitar que los datos influyan en la decisión diagnóstica del cirujano general de turno, se hizo el trabajo un estudio doble ciego. De los datos registrados por paciente, las variables relevantes fueron el informe histopatológico, las variables del score de Alvarado. Adicionalmente, se tomaron en cuenta: la localización y duración del dolor abdominal, dolor a la deambulación, signo de Dunphy, signo del talón, signo de Rovsing, signo de psoas. También se consideraron los datos de laboratorio: hematocrito, recuento leucocitario, porcentaje de neutrófilos, linfocitos y desviación a la izquierda. Del reporte operatorio se obtuvo el tiempo preoperatorio, grado de apendicitis y su posición. Se estudiaron variables intervinientes como la automedicación previa, la presencia de síntomas urinarios y cirugías abdominales previas.
Luego de elaborar la base de datos en Excel y verificar la limpieza de los datos, se importó al software estadístico SPSS V 24 (IBM SPSS Statistics for Windows, Versión 24.0. Armonk, NY: IBM Corp.). En la estadística descriptiva se calcularon medias y desviación estándar para variables cuantitativas; proporciones para variables cualitativas. En la estadística inferencial se utilizó chi cuadrado para comparar variables cualitativas y la prueba de t de Student para las variables cuantitativas, con un nivel de significancia menor a 5 % (p < 0,05). Se elaboraron 3 modelos de predicción con el análisis multivariado de variables predictoras, el primero incluyó a todos los datos recogidos, el segundo todas las variables dicotómicas, y el último, un modelo clínico que excluyó datos del laboratorio. Se calculó sensibilidad, especificidad, VPP, VPN, LR-, LR+ e índice de exactitud para cada variable predictora dicotómica de forma independiente y de cada modelo, asimismo, sus rendimientos diagnósticos fueron comparados a través de la curva ROC.
Resultados
Se evaluaron a 650 pacientes operados por sospecha de apendicitis aguda. Un total de 338 pacientes no fueron incluidos. De los 312 restantes, un total de 267 (85,58 %) pacientes tuvieron apendicitis aguda confirmada por estudio histopatológico (Fig. 1).
De los pacientes incluidos en el estudio, 177 fueron hombres (56,73 %) y 135 mujeres (43,27 %), con la edad media de 31 años (±11,3). Se reportó que 148 (47,44 %) pacientes iniciaron con un dolor visceral cólico (DVC) localizado en el epigastrio. Posteriormente presentándose como dolor somático permanente (DSP) hasta su ingreso a emergencia, con una mayor proporción, en fosa ilíaca derecha en 204 (65,38 %) pacientes; 278 (89,10 %) manifestaron una migración del dolor. El grado de apendicitis más frecuente descrito en el reporte quirúrgico fue la apendicitis supurada con 117 (37,50 %) pacientes. La posición del apéndice más frecuente fue la sub-ileal con 72 (23,08 %) casos. La media del valor del score de Alvarado fue 9 (±1), con un puntaje mínimo obtenido de 3 (Tabla 1).
Variables | n= 312 |
---|---|
Edad (años) | 31,28 ± 11,3 |
Femenino | 135 (43,27) |
Masculino | 177 (56,73) |
No presenta | 8 (2,56) |
Epigastrio | 148 (47,44) |
Periumbilical | 102 (32,69) |
Difuso | 32 (10,26) |
Otro | 22 (7,05) |
No presenta | 1 (0,32) |
CID | 97 (31,10) |
FID | 204 (65,38) |
CII | 1 (0,32) |
CSD | 1 (0,32) |
Otro | 8 (2,56) |
Sí | 278 (89,10) |
No | 34 (10,90) |
Sí | 194 (62,18) |
No | 118 (37,82) |
Catarral | 17 (5,45) |
Supurada | 117 (37,50) |
Gangrenada | 104 (33,33) |
Perforada | 74 (23,72) |
Retrocecal | 38 (12,18) |
Paracecal | 34 (10,90) |
Subcecal | 66 (21,15) |
Pélvica | 40 (12,82) |
Post-Ileal | 22 (7,05) |
Pre-Ileal | 40 (12,82) |
Sub-Ileal | 72 (23,08) |
Score de Alvarado | 9 ± 1 |
DVC= Dolor Visceral Cólico, DSP= Dolor Somático Permanente, CID= Cuadrante Inferior Derecho, FID= Fosa Iliaca Derecha, CII= Cuadrante Inferior Izquierdo, CSD= Cuadrante Superior Derecho.
Cada variable predictora fue analizada de manera independiente y se resumieron los resultados referentes a pruebas diagnósticas como la sensibilidad, especificidad, valor predictivo, Likelihood ratio, y el índice exactitud de cada uno (Tabla 2).
Predictores | S | E | VPP | VPN | LR+ | LR- | IE |
---|---|---|---|---|---|---|---|
Migración | ,90 | ,16 | ,86 | ,21 | 1,06 | 0,65 | ,79 |
Anorexia | ,92 | ,13 | ,86 | ,21 | 1,06 | 0,62 | ,80 |
Náuseas | ,87 | ,16 | ,86 | ,17 | 1,03 | 0,84 | ,77 |
Vómitos | ,72 | ,49 | ,89 | ,22 | 1,40 | 0,58 | ,68 |
Síntomas urinarios | ,11 | ,89 | ,86 | ,14 | 1,01 | 1,00 | ,22 |
Dolor a la deambulación | ,91 | ,09 | ,86 | ,14 | 1,00 | 1,01 | ,79 |
Signo de Dunphy | ,94 | ,16 | ,87 | ,30 | 1,11 | 0,39 | ,83 |
Sungo del talón | ,87 | ,22 | ,87 | ,22 | 1,12 | 0,59 | ,78 |
Resistencia Muscular | 1,00 | ,02 | ,86 | ,50 | 1,02 | 0,17 | ,86 |
Signo de Rovsing | ,89 | ,20 | ,87 | ,23 | 1,11 | 0,56 | ,79 |
Singo de Blumberg | ,93 | ,18 | ,87 | ,31 | 1,13 | 0,38 | ,82 |
Signo de psoas | ,67 | ,49 | ,89 | ,20 | 1,30 | 0,68 | ,64 |
Fiebre | ,86 | ,20 | ,86 | ,19 | 1,07 | 0,71 | ,76 |
Leucocitosis | ,90 | ,44 | ,91 | ,42 | 1,61 | 0,24 | ,83 |
Desviación a la izquierda | ,91 | ,42 | ,90 | ,45 | 1,58 | 0,20 | ,84 |
IE: Índice de Exactitud, VPP: Valor predictivo positivo, VPN: Valor predictivo negativo, LR+/-: Likelihood Ratio+/-, S: Sensibilidad,
E: Especificidad.
Se analizaron todas las variables predictoras, características clínicas y datos de laboratorio para el diagnóstico de apendicitis aguda, con una regresión logística, se obtuvo los siguientes modelos de score diagnóstico según la prueba de Wald. El modelo 1, usó las variables originales obtenidas de los protocolos, se observó que los neutrófilos tuvieron el más alto puntaje con 12,42. Para el modelo 2 las variables que eran cuantitativas se les atribuyeron un punto de corte para que todas sean cualitativas y dicotómicas. En el modelo 3, que es el modelo clínico o nuevo score a evaluar, se excluyeron todos los datos de laboratorio y se obtuvieron al sexo, vómitos, automedicación previa y signo de Blumberg como variables significativas; la variable vómitos obtuvo el valor más alto con 7,85 (Tabla 3).
Modelo 1 | ||||||
---|---|---|---|---|---|---|
Variables | B | Wald | Valor p | OR | IC 95 % | |
LI LS | ||||||
Vómitos | 0,74 | 3,89 | 0,049 | 2,09 | 1,01 | 4,35 |
Signo de Blumberg | 1,48 | 7,63 | 0,006 | 4,41 | 1,54 | 12,61 |
Recuento leucocitario | 0,01 | 8,84 | 0,003 | 1,01 | 1,00 | 1,02 |
Neutrófilos | 0,07 | 12,42 | 0,001 | 1,08 | 1,03 | 1,12 |
Constante | -7,85 | |||||
Modelo 2 | ||||||
Variables | B | Wald | Valor p | OR | IC 95 % | |
LI LS | ||||||
Vómitos | 0,92 | 6,13 | 0,013 | 2,51 | 1,21 | 5,19 |
Signo de Blumberg | 1,52 | 8,40 | 0,004 | 4,55 | 1,63 | 12,69 |
Desviación a la izquierda | 1,40 | 10,23 | 0,001 | 4,05 | 1,72 | 9,54 |
Leucocitosis | 1,51 | 12,19 | 0,000 | 4,52 | 1,94 | 10,54 |
Constante | -2,35 | |||||
Modelo 3 | ||||||
Variables | B | Wald | Valor p | OR | IC 95 % | |
LI LS | ||||||
Sexo | 0,82 | 5,74 | 0,017 | 2,26 | 1,16 | 4,41 |
Vómitos | 0,96 | 7,85 | 0,005 | 2,61 | 1,34 | 5,12 |
Automedicación previa | 0,79 | 5,38 | 0,020 | 2,21 | 1,13 | 4,31 |
Signo de Blumberg | 1,35 | 7,42 | 0,006 | 3,84 | 1,46 | 10,10 |
Constante | -0,858 |
Estos modelos son comparados con el score de Alvarado (puntaje MANTRELS) a través del gráfico de la curva ROC y el área bajo la curva. El modelo 3, que corresponde al nuevo score a evaluar, obtuvo 0,711. Todos los modelos resultantes estuvieron por encima del puntaje MANTRELS (Fig. 2).
Discusión
El diagnóstico oportuno de apendicitis aguda dentro de las patologías con dolor abdominal agudo siempre ha sido un reto. A través de los años se han propuesto scores diagnósticos de acuerdo con la necesidad o las características de la población evaluada. La primera propuesta de un sistema de score fue en el año 1983,13 y dio origen al score de Alvarado tres años después.10 Desde ese tiempo hasta la actualidad se han propuesto nuevos scores, con diferentes variables de laboratorio o de imágenes, así mismo, centradas para ciertas poblaciones como la pediátrica o embarazadas.14 A pesar de todas estas herramientas las dificultades al diagnosticar se mantienen, y más aún en un contexto de atención primaria, donde no se cuenta con todas las herramientas necesarias u oportunas para realizar el diagnóstico.
En el estudio realizado por Alvarado,10 se analizó cada indicador diagnóstico de manera independiente y se comparó con la “prueba de oro”, el reporte histopatológico. La diferencia entre el número de pacientes del estudio actual y su estudio es de 35, mientras que la proporción de pacientes sanos es muy similar, con sus 277 pacientes estudiados en total, 227 tenían apendicitis aguda. Si comparamos la sensibilidad de nuestros resultados con sus resultados de las variables estudiadas, vómitos, resistencia muscular y la leucocitosis son las 3 variables que más se asemejan. Por parte de la especificidad, en cambio, se demuestra que en el estudio actual se presentó pocos verdaderos negativos por variable; la variable de síntomas urinarios fue la variable con mejor rendimiento en cuanto a especificidad. La variable de resistencia muscular se asemeja al estudio de Alvarado en la especificidad, sin embargo, es inferior en el estudio actual. Las comparaciones con el estudio que dio paso al score de Alvarado son similares, corrobora la calidad del estudio expuesto actualmente y la versatilidad del score de Alvarado.
Otro score propuesto es el denominado score de Karaman y la principal diferencia con nuestra propuesta es que se compone de 6 variables,11 las cuales están incluidas en nuestro estudio de manera individual; anorexia, migración del dolor, signo de Dunphy, signo de Blumberg, leucocitosis y polimorfonucleares mayores al 70 %. En el estudio de Karaman, 200 pacientes fueron evaluados, de los cuales 166 tuvieron apendicitis según prueba histopatológica. En el desarrollo del estudio de Karaman también existe un análisis individual de los parámetros que comparados con nuestra propuesta se asemejan, excepto por la fiebre. En el estudio de Karaman se resalta que la fiebre posee una muy baja sensibilidad (29,5 %) y una especificidad alta (73,5 %), cifras opuestas con nuestra propuesta. También mencionan que los vómitos tuvieron una baja sensibilidad y especificidad, por esa razón, no forma parte de su score, sin embargo, este parámetro forma parte de nuestros 3 modelos resultantes del estudio multivariado, lo cual resalta su correlación con las otras variables. Esto puede significar que se basaron en el peso individual de cada variable para crear el score, y no su relación con las demás variables. La ventaja del método usado por Karaman fue que emplearon un score ya con un puntaje y parámetros establecidos, así se pudo calcular su rendimiento diagnóstico y su punto de corte. En cambio, en nuestro estudio, se estableció un nuevo modelo de score con un rendimiento diagnóstico comparable al de Alvarado.
En el score de Alvarado, se tomaba ya en cuenta los exámenes de laboratorio15,16 y concluían que por sí solas tenían un gran valor diagnóstico, siempre y cuando el valor de las pruebas sobrepasen sus rangos normales de manera marcada. Es por esto que se recomendaba su uso junto a la clínica y/o del uso combinado de 2 exámenes positivos de laboratorio. Estas conclusiones se afirman en estudios más actuales,17,18 añadiéndose que los valores altos en los resultados de los exámenes de laboratorio están altamente relacionados con la gravedad de la apendicitis, donde podríamos encontrar su verdadero uso, en vez de su aplicación diagnóstica.19 En el estudio presente se corrobora lo mencionado anteriormente, reflejándose en su buena sensibilidad y especificidad individualmente, y que, al formar parte de un modelo de score, como en el modelo 1 y 2, contribuyen de manera importante en el rendimiento diagnóstico de cada uno. En cambio, el modelo 3 o clínico, carece de la superioridad de los 2 modelos previos, por estar formado exclusivamente de variables de datos de historia clínica, signos y síntomas. Este nuevo score clínico mantiene la misma cantidad de variables, y reemplaza a los exámenes de laboratorio por automedicación previa y que el paciente sea del sexo masculino. El nuevo score clínico resulta ser inferior a los modelos 1 y 2; sin embargo, su rendimiento diagnóstico no es menor que del score de Alvarado, el cual posee entre sus variables, datos de laboratorio. Estos resultados se pueden deber a las características de la población estudiada y de la clínica presentada. El rendimiento diagnóstico de los modelos expuestos podría variar considerablemente si se estudiase una nueva población. Por estas razones a pesar de que el nuevo score clínico a evaluar es mejor según el área bajo la curva ROC, esta diferencia es mínima, tomándose esta ventaja como no significativa. Aun así, podemos considerar al modelo clínico como superior por ser más práctico al usar solo variables de anamnesis y hallazgos clínicos del paciente. Esta practicidad es muy importante en esta patología, ya que sus complicaciones pueden aumentar de no ser tratada oportunamente.
Se tuvieron ciertas limitaciones en la realización del estudio. Las variables predictoras estudiadas fueron limitadas en diversidad al ser seleccionadas de protocolos preexistentes, que datan del año 2015, e impiden agregar más variables. Por otro lado, al obtener una base de datos, no se pudo corroborar.
La diferencia entre el score de Alvarado y el modelo clínico resultante, no es muy significativo, este resultado sugiere realizar futuros estudios para mejorar el modelo clínico y agregar más variables predictoras al estudio. También se podría estudiar al modelo clínico como un método de screening o evaluación rápida para considerar el diagnóstico de apendicitis aguda y ser transferido a un servicio especializado. Esto es relevante dado que el diagnóstico descansa grandemente en la evaluación clínica actuada por el médico general en un primer momento; un adecuado modelo de score clínico evitaría demoras en el diagnóstico y transferencias oportunas o en su defecto interconsultas precoces.
Consideraciones finales
Los estudios de laboratorio contribuyen con un peso importante en los scores, sin embargo, aún dependen de los datos de la historia y la clínica para mantener el rendimiento diagnóstico adecuado. El nuevo modelo clínico de score es superior al score de Alvarado según el área bajo la curva ROC, pero no en un valor significativo. Ambos scores poseen un buen rendimiento diagnóstico.