Introducción
El diagnóstico de la apendicitis aguda es fundamentalmente clínico, basado en los antecedentes, el interrogatorio y el examen físico, y sirviéndose de los exámenes complementarios de laboratorio e imágenes. Se define como la inflamación aguda del apéndice cecal1 y constituye la urgencia quirúrgica más frecuente en la infancia.2
Se trata de una enfermedad cuyos síntomas y signos pueden coincidir con una variedad de entidades diferentes, haciendo su diagnóstico difícil sobre todo en las primeras horas de presentación. El pronóstico empeora en las fases avanzadas y aumenta la incidencia de gangrena y perforación; su diagnóstico tardío se relaciona con un incremento en la morbilidad por complicaciones, los costos y la estadía hospitalaria.1,2,3
Entre las herramientas disponibles para mejorar la precisión diagnóstica de la apendicitis aguda, se encuentra la escala de Alvarado, también conocida como MANTRELS por las siglas de sus elementos en inglés. Consta de ocho elementos: migración del dolor, anorexia, vómitos o náuseas, sensibilidad dolorosa a la palpación en cuadrante inferior derecho, dolor a la descompresión, temperatura elevada, leucocitosis y desviación a la izquierda del leucograma. Cada elemento aporta un punto excepto la sensibilidad dolorosa en el cuadrante inferior derecho y la leucocitosis, que aportan dos, para un total de diez puntos. Según su autor, un paciente con puntuación de 5 a 6 debía ser observado por ser compatible con apendicitis, y con 7 a 10 tendría recomendación de cirugía por ese diagnóstico.4
La utilidad de esta escala en la edad pediátrica ha sido refrendada por numerosos estudios para la estratificación de los casos con dolor abdominal según riesgo de apendicitis.2,3,5,6,7,8) Constituye un sistema de puntuación simple, práctico y económico, útil en escenarios con recursos limitados,9) y que además, no implica exposición a radiaciones, disponibilidad de ultrasonido, ni otros procederes invasivos.
Los autores de este trabajo publicaron el desempeño diagnóstico de esta escala en niños. Concluyeron que la escala tuvo un desempeño discriminativo general aceptable. Determinaron, sin embargo, que las insuficientes sensibilidad y especificidad en el punto de corte más equilibrado no permiten utilizarla como herramienta única para el diagnóstico de la apendicitis aguda en el escenario clínico pediátrico real. No obstante, la elevada sensibilidad por debajo de los cuatro puntos, permitiría descartar la enfermedad con un alto nivel de certeza.10
El presente informe de investigación tiene como objetivo determinar las diferencias en el desempeño diagnóstico de la escala de Alvarado para la apendicitis aguda pediátrica según grupos de edad y sexo.
Métodos
Se realizó un estudio observacional, analítico y prospectivo, en el Hospital Pediátrico Centro Habana entre enero de 2016 y enero de 2017. La población estuvo integrada por los casos que ingresaran en el servicio de Cirugía Pediátrica. Los criterios de inclusión fueron: diagnóstico al ingreso de dolor abdominal o apendicitis aguda, y edad entre 5 y 18 años. Los criterios de exclusión fueron: dolor abdominal de más de 72 horas de evolución, diagnóstico de plastrón apendicular y pacientes previamente apendicectomizados.
Una vez aplicados estos criterios, resultaron 452 casos que se dividieron en dos grupos: con apendicitis y sin apendicitis. Se usó el diagnóstico histológico como principal elemento discriminante, y se subdividieron según el diagnóstico predicho por la escala con 7 como punto de corte:
Grupo con apendicitis:
Aquellos con escala de Alvarado de 7 puntos o más que fueron operados y que tuvieron estudio histológico que informó apendicitis aguda (verdaderos positivos).
Aquellos con escala de Alvarado de 6 puntos o menos que fueron operados con diagnóstico histológico de apendicitis aguda; o que no fueron operados, pero reingresaron durante las dos semanas posteriores con diagnóstico de apendicitis aguda o plastrón apendicular (falsos negativos).
Grupo sin apendicitis:
Aquellos con escala de Alvarado de 6 puntos o menos que no fueron operados y no se presentaron durante las dos semanas posteriores con diagnóstico de apendicitis aguda o plastrón apendicular; o que fueron operados pero tuvieron diagnóstico histológico distinto de apendicitis aguda (verdaderos negativos).
Aquellos con escala de Alvarado de 7 puntos o más que no fueron operados; o aquellos operados en los que el informe histológico informó un diagnóstico distinto de apendicitis aguda (falsos positivos).
Se utilizaron las variables grupos de edad, sexo, diagnóstico de apendicitis y escala de Alvarado. Además, se calcularon la sensibilidad y la especificidad.
La sensibilidad es la probabilidad de que la escala arroje un resultado positivo en los enfermos con apendicitis aguda:
VP/(VP+FN).
La especificidad es la probabilidad de que la escala arroje un resultado negativo en los casos con diagnóstico negativo de apendicitis:
VN/(VN+FP).
El desempeño discriminativo general de la escala se determinó mediante el área bajo la curva Características Operativas del Receptor, la que se construyó con los valores de sensibilidad y 1-especificidad para cada punto de la escala de Alvarado, que constituyen sus coordenadas. Un área de 0,50 representa la distribución aleatoria y un valor de 1,0 la predicción perfecta.
La información proveniente de la fuente primaria se recogió al momento del ingreso mediante un modelo creado para ese fin. También se obtuvo información de las historias clínicas y los registros de anatomía patológica.
El procesamiento de la información se realizó mediante el paquete estadístico SPSS 25,0 (IBM Corp. 1989-2017). Se emplearon estadísticas descriptivas como frecuencias absolutas y relativas (porcentajes). Como métodos de estadística inferencial se empleó el test de Ji- cuadrada para variables cualitativas. Se utilizó un intervalo de confianza de 95 % y se consideró que las diferencias entre grupos fueron estadísticamente significativas con un valor de la p < 0,05.
Los parámetros éticos estuvieron en concordancia con la Declaración de Helsinki.11 El protocolo de la investigación obtuvo la aprobación del Comité de Ética de la institución. Los datos de los pacientes se recogieron de forma anónima. Los casos se ingresaron, diagnosticaron y trataron sobre la base del criterio de los especialistas y residentes del servicio de Cirugía Pediátrica, independientemente de los datos de la investigación y del puntaje obtenido en la escala de Alvarado.
Resultados
En general no hubo diferencias estadísticamente significativas entre los grupos de edad y sexo, sin embargo, al estratificarlos según diagnóstico de apendicitis, sí hubo diferencias significativas entre estas variables para los casos negativos (tabla 1).
Casos positivos de apendicitis (n= 348): (2= 0,094. Significación p=0,76. Casos negativos de apendicitis (n= 104): (2= 4,719. Significación p=0,03. Total de casos: (2= 2,382. Significación p=0,12.
La tabla 2 informa acerca de los valores de sensibilidad y especificidad calculados para cada puntaje de la escala de Alvarado, en las cuatro diferentes combinaciones de grupos de edad y sexo.
La figura muestra las Curvas de Características Operativas del Receptor para la escala de Alvarado en las cuatro combinaciones de grupos de edad y sexo. Las curvas se construyen a partir de sus coordenadas, que son los valores de sensibilidad y 1-especificidad para cada puntaje de la escala (tabla 2).
La tabla 3 muestra el Área bajo la Curva de Características Operativas del Receptor según las combinaciones de grupo de edad y sexo, así como los resultados del análisis estadístico realizado. Las curvas están representadas en la figura 1.
Discusión
El análisis estadístico en la tabla 1 permite afirmar que, aunque en general no hubo diferencias estadísticamente significativas entre los diferentes grupos de edad y sexo (p=0,12), al estratificarse según diagnóstico positivo o negativo de apendicitis aguda, se demostró que para los casos negativos sí hubo diferencias significativas entre estas variables (p=0,03). Esto se debe a que en este grupo particular las adolescentes femeninas tuvieron un franco predominio, representando el 54,8 % de los casos negativos.
Los resultados publicados previamente por los autores indican que en esta población, para 7 puntos como patrón de corte de la escala, la sensibilidad fue de 62 % y la especificidad de 90 %, además de que el punto de corte más equilibrado se determinó en 6, y un puntaje menor de 4 permitiría descartar la apendicitis aguda.10) Sin embargo, la interpretación de la tabla 2 resalta las diferencias existentes entre los diferentes subgrupos resultantes de las combinaciones según edad y sexo.
De tal forma, en los escolares masculinos la sensibilidad en los 7 puntos fue de 72,3 % y la especificidad fue de 100 %, o sea que de este subgrupo, el 72,3 % de aquellos con apendicitis tuvieron puntajes de 7 o más, y de los que no tuvieron apendicitis, todos obtuvieron puntajes por debajo de 7. En los adolescentes masculinos la sensibilidad para el mismo punto de corte fue de 64,1 % y la especificidad de 84,6 %. Las pacientes femeninas en edad escolar tuvieron sensibilidad de 71,2 %y especificidad de 90,5% para el punto de corte en 7. Por su parte, el subgrupo de las adolescentes femeninas tuvo en este punto de corte sensibilidad de 44,9% y especificidad de 89,5 %. Esta sensibilidad fue muy baja con respecto a la población general y los otros subgrupos, indicando que solo el 44,9 % de estas pacientes con apendicitis, fueron correctamente predichas como tal por la escala al obtener 7 o más puntos.
Examinando la literatura disponible en este tópico, encontramos que Mandeville y otros, evaluaron la escala de Alvarado en niños entre 4 y 17 años con sospecha de apendicitis según el sexo. En el punto de corte en 7, encontraron en los varones una sensibilidad de 84 %, una especificidad de 66 % y un valor predictivo positivo de 80,8 %; y en las hembras la sensibilidad fue del 55 %, la especificidad de 82 % y el valor predictivo positivo de 70,2 %. Concluyeron que en general el desempeño de la escala fue mejor en los varones.5) Tan y otros, basados en las diferencias que encontraron, propusieron que en hombres el rango dudoso de la escala que requeriría de más investigaciones es el de 4 a 6 puntos, mientras que en mujeres este se debía extender de 4 a 9 puntos.12
La figura 1 representa las curvas de Características Operativas del Receptor para cada subgrupo derivado de las combinaciones de grupos de edad y sexo. Estas curvas se construyeron a partir de los valores de sensibilidad y 1-especificidad obtenidos en la tabla 2, y permiten apreciar gráficamente las diferencias existentes entre estos subgrupos. La tabla 3 contiene el área bajo la curva, que se interpreta como el poder discriminativo de la escala de Alvarado, así como los resultados del análisis estadístico realizado. En general, es fácilmente apreciable que el valor discriminativo de la escala fue superior en el grupo de edad escolar con respecto a los adolescentes, y que en cada caso el desempeño para el sexo masculino superó al del femenino. Sin embargo, las diferencias más notables se percibieron al agrupar las variables según sus diferentes categorías, encontrándose un desempeño marcadamente superior de la escala en los niños varones de edad escolar, con un área bajo la curva de 0,918, mientras que en las adolescentes de sexo femenino se encontró un área más discreta, de solo 0,802. El área bajo la curva para los adolescentes de ambos sexos se encontró por debajo del límite inferior del intervalo de confianza para los escolares masculinos, lo cual le aporta significación estadística a esta diferencia.
Lipsett y Bachur han afirmado que en el futuro, el enfoque diagnóstico óptimo para los pacientes pediátricos con sospecha de apendicitis deberá incluir una estratificación de riesgo ajustada a la edad y al género.13 Recientemente se ha desarrollado el Pediatric Appendicitis Risk Calculator, derivado de una muestra de 2 423 niños y validado en 1 426, y entre las variables que comprende se encuentran incluidas la edad y el sexo.14 Otros modelos de predicción clínica de apendicitis en niños que tienen en cuenta el sexo son el de Lintula,15) el de Lindberg modificado,16) y el INFURG-SEMES.17) Un estudio determinó que la escala de Alvarado funciona mejor en el sexo femenino que en el masculino, en aparente contraste con los resultados presentados, aunque tiene en cuenta todos los grupos de edades incluyendo adultos.18 En una revisión sistemática se ha afirmado que la escala de Alvarado es una herramienta bien calibrada en hombres, inconsistente en niños y que sobrepredice la probabilidad de apendicitis en mujeres.19) Se ha descrito que las apendicectomías negativas son más frecuentes en niñas o adolescentes postmenárquicas y a esta población específica Scheller y otros, dirigieron su investigación que utiliza la Escala de Apendicitis Pediátrica y encuentran que muestra mejor especificidad y equivalente sensibilidad para las adolescentes femeninas con respecto a los otros pacientes.20 Al respecto, Dahn y Milne comentan que la Escala de Apendicitis Pediátrica tiene utilidad similar en pacientes adolescentes femeninas en comparación con otros pacientes pediátricos, y que tanto la Escala de Apendicitis Pediátrica como la de Alvarado, deben utilizarse para estratificar los casos según riesgo de apendicitis.21) Sin embargo, estos estudios no evaluaron específicamente la utilidad de la escala de Alvarado en adolescentes femeninas.
Los resultados distintivos que se discuten pueden estar relacionados con la alta incidencia de enfermedades ginecológicas que se comienzan a manifestar en esta edad, incluso en las pacientes que no tienen vida sexual activa; en combinación con la no disponibilidad de ultrasonido de forma permanente en el hospital donde se realizó el estudio, que podría ayudar a diagnosticar algunas de estas entidades, lo que incrementó la necesidad de ingresar casos en los que a priori no se podía descartar la apendicitis aguda, y que definitivamente no la tuvieron. Otros factores que podrían influir en este resultado deben ser estudiados enfocándose en este grupo particular.
Entre las limitaciones de la investigación, se encuentra la posible variabilidad interobservador entre los profesionales que recogieron la información primaria, aunque los autores supervisaron en las historias clínicas la veracidad de los datos que sumaron puntos a la escala. Además, como informaron los autores en una publicación previa con la misma población,10 el tiempo prolongado para algunos casos entre el cálculo de la escala y el diagnóstico definitivo pudo haber dado lugar a falsos negativos.
En conclusión, en los pacientes sin apendicitis hubo un predominio significativo de adolescentes femeninas. La escala de Alvarado tuvo un buen valor discriminativo en los escolares de sexo masculino, comparativamente superior al grupo de edad adolescente, encontrándose el desempeño discriminativo más pobre en las adolescentes de sexo femenino.