INTRODUCCIÓN
La apendicitis aguda es la enfermedad aguda quirúrgica más común del abdomen,1 y la causa más frecuente de cirugía urgente en la infancia.2 Se define como la inflamación aguda del apéndice cecal.3 Su incidencia presenta un pico entre las edades de 11 y 12 años y es más frecuente en el sexo masculino.1
El diagnóstico de la apendicitis aguda es fundamentalmente clínico, basado en los antecedentes, el interrogatorio y el examen físico; los exámenes de laboratorio e imágenes son de utilidad también, sin embargo, sus síntomas y signos pueden coincidir con enfermedades diferentes que pueden hacer su diagnóstico difícil en la infancia, sobre todo en las primeras horas de presentación.
El diagnóstico tardío ensombrece el pronóstico y aumenta la incidencia de gangrena y perforación. 2,4,5) Aunque la experiencia clínica y los avances en los métodos de imagen han mejorado la exactitud de este ejercicio, la enfermedad continúa siendo una causa significativa de morbilidad por complicaciones, aumento de la estancia hospitalaria, los costos y raramente de muerte.1,6
En 1986, Alfredo Alvarado propuso una escala o puntaje práctico que lleva su nombre, para el diagnóstico de la apendicitis aguda. La escala también se conoce como MANTRELS, por las siglas de sus ocho elementos en inglés: migración del dolor, anorexia, vómitos o náuseas, sensibilidad dolorosa a la palpación en cuadrante inferior derecho, dolor a la descompresión, temperatura elevada, leucocitosis y desviación a la izquierda del leucograma.
El creador otorgó un punto a cada uno exceptuando la sensibilidad dolorosa en el cuadrante inferior derecho y la leucocitosis, a los que otorgó dos puntos por haber resultado con más poder predictivo, para un total de diez puntos. Propuso que un paciente con puntuación de 5 a 6 debía ser observado por ser compatible con apendicitis, y con 7 a 10 tendría recomendación de cirugía por ese diagnóstico.7
Constituye un sistema de puntuación simple, práctico, económico y confiable; puede ser implementado con poca dificultad, y se recomienda para mejorar el diagnóstico de la apendicitis aguda en escenarios donde los recursos son limitados. 8) Su utilidad en niños está refrendada por múltiples estudios.4,9,10,11
En la edad pediátrica, el deseo de limitar la exposición a las radiaciones de la tomografía, el elevado costo de este proceder y su no disponibilidad en muchas instituciones unido a la variabilidad interobservador y el no poder hacer ultrasonido todo el tiempo así como la invasividad, elevado costo y disponibilidad inconstante de la laparoscopía diagnóstica en muchos centros, convierten en un desafío la tarea de lograr un diagnóstico temprano para la apendicitis aguda, por lo que se requieren métodos rápidos, seguros, no invasivos y costo efectivos que aporten a este propósito.
Teniendo en cuenta esto, se decidió realizar la presente investigación, con el objetivo de determinar el desempeño diagnóstico de la escala de Alvarado para la apendicitis aguda en el niño.
MÉTODOS
Se realizó un estudio observacional, analítico y prospectivo, en el Hospital Pediátrico Centro Habana entre enero de 2016 y enero de 2017. La población estuvo integrada por los casos que ingresaran en el Servicio de Cirugía Pediátrica. Los criterios de inclusión fueron: diagnóstico al ingreso de dolor abdominal o apendicitis aguda, y edad entre 5 y 18 años. Los criterios de exclusión fueron: dolor abdominal de más de 72 horas de evolución, diagnóstico de plastrón apendicular y pacientes previamente apendicectomizados.
Una vez aplicados estos criterios, resultaron 452 casos que se dividieron en dos grupos: Apendicitis y No apendicitis. Se usó el diagnóstico histológico como principal elemento discriminante, y se subdividieron según el diagnóstico predicho por la escala con 7 como punto de corte:
Grupo Apendicitis:
con escala de Alvarado de 7 o más que fueron operados y que tuvieron estudio histológico que informó apendicitis aguda (verdaderos positivos).
con escala de Alvarado de 6 o menos que fueron operados con diagnóstico histológico de apendicitis aguda; o que no fueron operados, pero reingresaron durante las dos semanas posteriores con diagnóstico de apendicitis aguda o plastrón apendicular (falsos negativos).
Grupo No Apendicitis:
con escala de Alvarado de 6 o menos que no fueron operados y no se presentaron durante las dos semanas posteriores con diagnóstico de apendicitis aguda o plastrón apendicular; o que fueron operados, pero tuvieron diagnóstico histológico distinto de apendicitis aguda (verdaderos negativos).
con escala de Alvarado de 7 o más que no fueron operados; o aquellos operados en los que el informe histológico informó un diagnóstico distinto de apendicitis aguda (falsos positivos).
Se utilizaron las variables edad, grupos de edad, sexo, diagnóstico de apendicitis y escala de Alvarado. Además, se calcularon los siguientes indicadores de resultados, donde VP: verdaderos positivos; FN: falsos negativos; VN: verdaderos negativos; FP: falsos positivos:
Otros indicadores de la escala:
Sensibilidad: probabilidad de que la escala arroje un resultado positivo en los enfermos con apendicitis aguda: VP/(VP+FN).
Especificidad: probabilidad de que la escala arroje un resultado negativo en los casos con no apendicitis: VN/(VN+FP).
Valor predictivo positivo: probabilidad de presentar apendicitis aguda si la escala ha predicho un diagnóstico positivo: VP/(VP+FP).
Valor predictivo negativo: probabilidad de no presentar apendicitis aguda si la escala ha predicho un resultado negativo: VN/(VN+FN).
Precisión diagnóstica: casos correctamente diagnosticados como una proporción de todos los casos: (VP+VN) / (VP+VN+FN+FP).
El desempeño discriminativo general de la escala: se determinó mediante el área bajo la curva Características Operativas del Receptor, la que se construyó con los valores de sensibilidad y 1-especificidad para cada punto de la escala de Alvarado, que constituyen sus coordenadas. Un área de 0,50 representa la distribución aleatoria y un valor de 1,0 la predicción perfecta.
La información proveniente de la fuente primaria se recogió al momento del ingreso mediante un modelo creado para ese fin. También se obtuvo información de las historias clínicas y los registros de anatomía patológica.
El procesamiento de la información se realizó mediante el paquete estadístico SPSS 25.0 (IBM Corp. 1989-2017). Se emplearon estadísticas descriptivas como frecuencias absolutas y relativas (porcentajes), y medidas de tendencia central y de dispersión. Como métodos de estadística inferencial se emplearon el test de chi cuadrado para variables cualitativas, así como la prueba no paramétrica U de Mann-Whitney para variables cuantitativas. Se utilizó un intervalo de confianza del 95 % y se consideró que las diferencias entre grupos fueron estadísticamente significativas con un valor de la p < 0,05.
Los parámetros éticos estuvieron en concordancia con la convención de Helsinki. El protocolo de la investigación obtuvo la aprobación del Comité de Ética de la institución. Los datos de los pacientes se recogieron de forma anónima. Los casos se ingresaron, diagnosticaron y trataron sobre la base del criterio de los especialistas y residentes del servicio de Cirugía Pediátrica, independientemente de los datos de la investigación y del puntaje obtenido en la escala de Alvarado.
RESULTADOS
La edad media de los 452 casos incluidos fue 12,41 años con una desviación típica de 3,61 años. Eran adolescentes 61,1 % de los pacientes, mientras que la distribución entre sexos fue equitativa. El análisis estadístico no demostró diferencias significativas entre las variables en contingencia (tabla 1).
Presentaron apendicitis el 77,0 % de los casos (348 de 452). Hubo 217 pacientes (48 %) con 7 o más puntos que presentaron apendicitis, y 10 pacientes (2,2 %) con 7 puntos o más no la presentaron. 131 casos (29 %) con apendicitis tuvieron puntajes menores que 7. No hubo casos con diagnóstico de apendicitis y puntajes de hasta 2 puntos, y solo 3 casos (0.7 %) con apendicitis alcanzaron los 3 puntos.
Se obtuvo una media para la escala de Alvarado de 6,28 puntos, la mediana y la moda fueron de 7 puntos, y la desviación típica de 2,081.
Los pacientes con diagnóstico positivo de apendicitis aguda tuvieron una media de 6,91 puntos (IC 95 %: 6,73-7,08), mientras que la media para los pacientes con diagnóstico negativo fue de 4,18 puntos (IC 95 %: 3,81-4,56). La diferencia entre estas medias fue estadísticamente significativa, según el resultado de la prueba U de Mann-Whitney (Fig.1).
Los indicadores de resultados calculados para un punto de corte en 7 fueron: sensibilidad de 0,62; especificidad de 0,90; valor predictivo positivo de 0,95; valor predictivo negativo de 0,41 y precisión diagnóstica de 0,68.
La tabla 2 informa acerca de los valores de Sensibilidad y 1-Especificidad calculados para cada puntaje de la escala de Alvarado, los cuales a su vez constituyen las coordenadas para la curva de Características Operativas del Receptor.
Positivo si es mayor o igual que* | Sensibilidad | 1 - Especificidad |
---|---|---|
-1,00 | 1,000 | 1,000 |
0,50 | 1,000 | 0,952 |
1,50 | 1,000 | 0,904 |
2,50 | 1,000 | 0,846 |
3,50 | 0,991 | 0,644 |
4,50 | 0,897 | 0,442 |
5,50 | 0,767 | 0,250 |
6,50 | 0,624 | 0,096 |
7,50 | 0,397 | 0,038 |
8,50 | 0,190 | 0,010 |
9,50 | 0,040 | 0,000 |
11,00 | 0,000 | 0,000 |
*El valor de corte más pequeño es el valor mínimo de prueba observado menos 1 y el valor de corte más grande es el valor máximo de prueba observado más 1. Todos los demás valores de corte son los promedios de los dos valores de prueba observados solicitados consecutivos.
La figura 2muestra la Curva de Características Operativas del Receptor para la escala de Alvarado, obtenida a partir de sus coordenadas que son los valores de sensibilidad y 1-especificidad para cada puntaje de la escala.
DISCUSIÓN
En la tabla 1 se puede apreciar que predominaron los pacientes del grupo de edad adolescentes, y hubo una cantidad igual de casos de cada sexo. Hubo un predominio estadísticamente no significativo de las adolescentes femeninas, con 32,3 %. La p= 0,12 indica que los casos estudiados tuvieron una distribución homogénea de acuerdo con las variables en contingencia.
Una investigación realizada en los Estados Unidos con 2 133 niños de entre 3 y 18 años con sospecha de apendicitis aguda, encontró una distribución masculino-femenino similar, con 52 % vs 48 %. Sin embargo, en contraste con el presente estudio, los adolescentes representaron solo el 40 % del total.12 El predominio de adolescentes y el rango de 5-18 años de la presente investigación explica que la edad media obtenida de 12,41 años sea discretamente superior a la mayoría de las fuentes bibliográficas. Van den Boom y otros, obtuvieron una media de 12 años (rango 0-17 años). 13) Otras investigaciones la cifran en 9,9 años (rango 3-16 años), 14) 10,12 años, 15) y en 11,7 años. 16) En todos los casos la edad media se aproxima al pico de 10-12 años en el cual se alcanza la mayor cantidad de tejido linfoide en el apéndice cecal y que coincide con la mayor incidencia de apendicitis aguda.1
En la literatura revisada, cuando se han estudiado niños con sospecha de apendicitis, los casos con diagnóstico positivo de la enfermedad representaron 63 %,9 o 55 %,10 40 %,12 36,4 %,15 o solo 29 %.16 Estos son valores menores comparados con la presente investigación (77,0 %), ya que por su diseño incluyen pacientes atendidos en los servicios de urgencia sin que necesariamente ingresaran.
La diferencia entre los valores medios de la escala para el diagnóstico positivo y negativo de apendicitis fue estadísticamente significativa, sin embargo, la diferencia aritmética entre estos valores ha sido comparativamente mayor en algunos estudios con poblaciones pediátricas, como el de Mandeville y otros, con 7,2 y 5,2 respectivamente,10 y el de Pogorelic y coautores con 8,2 y 6,7 puntos, respectivamente.11Así también ocurrió en la investigación que dio origen a la escala de Alvarado, donde las medias fueron de 7,71 y 5,24 puntos, respectivamente.7
Para calcular la sensibilidad, la especificidad, el valor predictivo positivo, el valor predictivo negativo, y la precisión diagnóstica de la escala, se escogió como demarcación el punto de corte en 7, ya que el autor de la herramienta originalmente propuso para los casos con puntajes de 7 en adelante, la recomendación de cirugía,7 además de que la mayor parte de la literatura considera este límite en sus propias series, lo cual es útil a la hora de realizar comparaciones.
Se ha publicado que la escala de Alvarado tiene una sensibilidad del 76 al 100 % y especificidad del 79 al 87 %. 1) El propio Alvarado obtuvo originalmente una sensibilidad de 81 % y una especificidad de 74 %. 7) En cuanto a estudios con solo pacientes pediátricos, Pogorelic y otros ubican la sensibilidad en 89 %, la especificidad en 59 %, y el valor predictivo positivo en 93,1%.11Sencan y otros, cifraron la sensibilidad en 76,19 %, la especificidad en 38,89 %, el valor predictivo positivo en 74,42 % y valor predictivo negativo en 41,8 %.14 Para Abou y coautores, el valor predictivo positivo es de 80,7 %.17
Para mejorar su sensibilidad y especificidad, así como valor predictivo, muchos han propuesto complementar la herramienta con estudios de imagen, con buenos resultados.8,17,18,19,20
Los valores inferiores de algunos de estos indicadores en el presente estudio, se deben sobre todo a que hubo una significativa cantidad de casos con apendicitis y puntajes menores de 7. Además, el tiempo transcurrido entre el cálculo de la escala para un paciente y su tratamiento quirúrgico, puede prolongarse en los casos internados para observación, quienes posiblemente habían ingresado con un puntaje menor de 7 y al evolucionar, este pudo haber aumentado. Sin embargo, no es política del servicio de Cirugía Pediátrica la realización de leucogramas seriados para los casos con sospecha de apendicitis aguda, por lo que la escala solo se pudo calcular al momento del ingreso, cuando este complementario se realiza. Es posible que esto haya dado lugar a casos falsos negativos.
La tabla 2 contiene los datos de Sensibilidad y 1 - Especificidad para los diferentes puntajes de la Escala de Alvarado. Estos valores constituyen las coordenadas de la Curva de Características Operativas del Receptor (Fig. 2). Se puede apreciar que, a mayores valores del punto de corte, mayor fue la especificidad y menor resultó la sensibilidad. El punto de corte óptimo para descartar apendicitis aguda se determinó en 4, ya que aquí la sensibilidad fue de 0,99; o sea que para los puntajes de hasta 3, solo el 1 % de los casos con apendicitis no fueron predichos como tal por la escala. Otras fuentes han coincidido en descartar la entidad para la edad pediátrica con puntajes menores de 4. 19,21) Esto contrasta con la conclusión original de Alvarado de que con puntajes de hasta 4 se podía descartar la enfermedad, 7) corroborado esto por Ohle y otros. 22) Se determinó en 9 el punto de corte óptimo para confirmar apendicitis, ya que aquí la elevada especificidad de 0,99 permite afirmar que solo el 1 % de los casos no enfermos fueron incorrectamente predichos como tal.
El punto de corte más equilibrado que se obtuvo fue el de 6, donde la sensibilidad fue de 0,76 y la especificidad de 0,75. Sin embargo, estos valores son insuficientes para utilizar la escala como herramienta diagnóstica única en la determinación de una conducta en el escenario clínico real, ya que aproximadamente una cuarta parte de los casos con apendicitis aguda presentaron puntajes por debajo de este límite, mientras que una cuarta parte de los pacientes negativos para apendicitis aguda, presentaron un puntaje igual o superior. A diferencia de este resultado, la mayoría de los autores han coincidido en determinar el punto de corte óptimo de la escala en 7, en correspondencia con el modelo original.9,11,18
La obtención de los diferentes valores de puntos de corte pudiera tener aplicación práctica. Se ha planteado que la escala es útil en escenarios donde los pediatras y médicos emergencistas son quienes se enfrentan a estos niños, para descartar la enfermedad o para estratificar los pacientes en tres grupos: los que deben remitirse a consulta con el cirujano o ingresar, los que deben proceder a observación o estudios de imagen, y los que pueden ser dados de alta.6,19,22,23,24,25Los autores opinan que podría ser de utilidad también en centros de atención primaria, o secundaria donde no hay servicio de Cirugía Pediátrica, para decidir si un caso se debe remitir a un hospital que sí cuente con este servicio.
El área bajo la Curva de Características Operativas del Receptor representa el desempeño discriminativo general de la escala, y se determinó en 0,85. Un valor de 0,50 representa la distribución aleatoria y un valor de 1,0 la predicción perfecta, por lo que se puede calificar el desempeño obtenido como aceptable. Wu y otros, han publicado que en comparación con otra herramienta, la escala de Alvarado obtuvo en niños más área bajo la curva en cualquier momento de la evolución de los síntomas en que se aplique, con 0,90 para el día 1; 0,87 para el día 2 y 0,88 para el día 3. 9) En contraste, Sencan y otros, obtuvieron un área de solo 0,57.14
Se concluye que la escala de Alvarado tuvo una buena especificidad y valor predictivo positivo para el punto de corte propuesto originalmente. A pesar de haber demostrado un desempeño discriminativo general aceptable, las insuficientes sensibilidad y especificidad obtenidas en el punto de corte más estable hicieron que la escala no resulte apropiada como herramienta única para el diagnóstico de la apendicitis aguda en el escenario clínico pediátrico real. No obstante, la elevada sensibilidad por debajo de los cuatro puntos en la escala, permitiría descartar la enfermedad con un alto nivel de certeza.