Introducción
El análisis estadístico implicativo (ASI) surgió por los años 80 para resolver problemas de la Didáctica de las matemáticas. 1 Más recientemente, Sagaró y Zamora,2 fundamentaron su empleo en las ciencias médicas y han aparecido varias investigaciones que lo han empleado para identificar factores de riesgo y pronósticos siguiendo la metodología denominada ASI-IMC (acrónimo de la metodología de empleo del análisis estadístico implicativo en las investigaciones médicas de causalidad), propuesta por estas autoras, como las investigaciones de García, Moraga, Páez, Galano, Pardo, todas citadas por estas autoras. (2
Se expone en este trabajo un ejemplo de la aplicación de las cinco primeras etapas de la metodología “ASI-IMC” en un estudio para identificar factores pronósticos de mortalidad por cáncer de mama, teniendo en cuenta que estos factores son de suma importancia, pues con frecuencia, guían el proceder clínico de médicos y otros profesionales de la salud, al predecir el curso clínico de una enfermedad, establecer grupos de riesgo y tomar decisiones terapéuticas individualizadas a fin de prolongar con calidad, la vida de los pacientes.
La entidad seleccionada fue el cáncer de mama, dada su elevada incidencia, prevalencia y letalidad en el mundo, el país (28,2 fallecidas por 100 mil mujeres en 2018) 3) y la provincia donde se realiza el estudio.
Para verificar que este era un problema de salud y tener una primera aproximación que permitiera pasar a un estudio analítico se realizaron estudios descriptivos, de tendencia, supervivencia, estimación de los años de vida potencialmente perdidos, entre otros, los cuales constituyeron tesis de la especialidad de Bioestadística y otros publicados, como el de Rodríguez y colaboradores. 4
Por lo que el objetivo de este trabajo es evaluar la efectividad de la metodología de aplicación del ASI y, colateralmente, identificar los factores pronósticos de mortalidad por cáncer de mama en el territorio estudiado.
Métodos
Se realizó un estudio observacional analítico prospectivo de tipo casos y controles anidado en una cohorte cuyo universo de estudio quedó conformado por todas las mujeres mayores de 18 años de edad con el diagnóstico clínico e histológico de cáncer de mama, procedentes de la provincia de Santiago de Cuba, que fueron atendidas en el Hospital Oncológico “Conrado Benítez”, en el período de estudio, constituyendo los casos todas las fallecidas al final del período de estudio y los controles una muestra de las vivas en igual momento.
El período de reclutamiento se extendió de junio de 2014 a abril de 2019. Este período se estimó en base a la ocurrencia habitual de fallecidas a causa de esta entidad para garantizar un tamaño de muestra acorde con los requerimientos de la regresión logística que se emplea en una fase posterior a este estudio para comparar con la regresión logística.
Al estar los casos y controles anidados en una cohorte cada caso fue seleccionándose a medida que ocurría un fallecimiento (caso incidente) y para aumentar la comparabilidad entre los grupos se escogió un control por cada caso, en el mismo momento, empleando un muestreo simple aleatorio a partir del listado de historias clínicas de pacientes con fecha de diagnóstico de no más o menos un mes de diferencia con respecto al caso actual, dada la existencia de este registro en el Departamento de Registros Médicos del hospital, lo cual facilitó la localización de las historias seleccionadas. Los controles que fallecieron en el periodo de estudio convirtiéndose en casos fueron sustituidos por otro control.
Se admitieron como criterios de exclusión el ser paciente fallecida por causa ajena a la enfermedad en estudio o paciente con enfermedad concomitante como Diabetes Mellitus, que pudiera interferir en la validez de los resultados del estudio. Se tomó un control por cada caso para una razón 1:1, para un total de 140 casos y 140 controles.
La selección de variables se realizó a partir de la revisión de la literatura, consulta a expertos y resultados de los dos estudios pilotos realizados por Moraga 5 y Pardo, 6 empleando 25 covariables, relacionadas con la paciente, el tumor, el tratamiento y el diagnóstico.
Se realizó una extensa búsqueda bibliográfica en las bases de datos biomédicas de la Internet para determinar el estado actual del problema en estudio. Para conocer los datos estadísticos de morbilidad y mortalidad se consultaron los anuarios estadísticos de salud de la Dirección Provincial de Estadística y de la Dirección Nacional de Registros Médicos y Estadísticas de Salud del Ministerio de Salud Pública.
La recolección del dato primario se realizó mediante la revisión de las historias clínicas de los casos y los controles que integraron la muestra del estudio, los informes de anatomía patológica y otros documentos con información de las variables en estudio. Para este fin, se confeccionó un formulario que recoge la información necesaria.
Se aplicaron las cinco primeras etapas previstas en la metodología ASI-IMC: análisis exploratorio, transformación de los datos duplicando la variable dependiente, análisis principal con la variable dependiente como principal y como suplementaria, presentación de los resultados e interpretación de los mismos, según se describe en Sagaró y Zamora. 7
Sistemas informáticos y procesadores estadísticos empleados:
Microsoft Excel del paquete Office 2016, para confeccionar la base de datos en formatocsv como condición necesaria para la aplicación del software específico CHIC (del francés: ClassificationHiérarchiqueImplicative et Cohésitive que significa Clasificación Jerárquica, Implicativa y Cohesitiva), el cual proporciona de forma rápida, gran cantidad de cálculos y gráficos.
CHIC 5.0, para obtener el modelo basado en el análisis estadístico implicativo, así como los gráficos ilustrativos de la técnica.
R 3.2.0 y el RStudio 1.0.44 como entorno de desarrollo integrado sobre el cual se corrió el R para el cálculo del tamaño de muestra.
Resultados
Al examinar la distribución de frecuencias absolutas y relativas de los factores pronósticos considerados en casos y controles se observa un predominio de los tipos histológicos agresivos, tanto en casos como en controles con un 85,71 % y un 76,43 %, respectivamente. La necrosis (52,14 y 50 %), la desmoplasia (56,43 y 55,71 %), la histiocitosis ganglionar (47,86 y 45,71 %), el margen quirúrgico libre (55,71 y 43,57 %) y la hormonoterapia (45 y 47,86 %) estuvieron presentes en, aproximadamente, la mitad de las pacientes de ambos grupos; el estadio (69.29 %) y la metástasis (52,14 %) también se presentó en aproximadamente la mitad de las fallecidas, no así en las vivas y el resto de los factores presentó baja frecuencia.
Al analizar la asociación entre cada uno de los factores y el estado viva o fallecida de las pacientes se pudo constatar que las diferencias significativas fueron en cuanto al estadio, el tamaño tumoral, la afectación ganglionar, la metástasis, la quimioterapia y los biomarcadores con más de un 99% de confiabilidad, para el grado de diferenciación nuclear y la invasión perineural, con un 95%; y para el tipo histológico y el margen quirúrgico con un 90 % de confiabilidad. El resto de los factores no resultaron significativamente asociados.
Se tabularon los índices de similaridad para las clases formadas y se especificó si esta forma parte de una clase mayor que contiene al peor o mejor desenlace. Siguiendo la metodología de aplicación del ASI también se tabularon los índices de cohesión para las reglas o metarreglas formadas.
El árbol de similaridad que se aprecia en la figura 1, muestra la agrupación de los factores pronósticos según el índice de similaridad de Lerman y los nodos significativos (en trazos más gruesos de color rojo), que se forman en los niveles 1, 4, 7, 11, 15, 17, 19, 21 y 24; siendo el nivel 1 el más significativo.
Aunque finalmente todos los factores se unen, si se toma como referencia un nivel de similaridad de 0,0115306, en el árbol se evidencia la formación de tres clases de cuasiequivalencia que engloban a todos los factores con un índice superior al referido. En una de las clases se reúnen las vivas con los biomarcadores y el tratamiento hormonal (C1), en la otra se agrupan las fallecidas con el resto de los supuestos factores pronósticos (C2), excepto la desmoplasia y la histiocitocis ganglionar que conforman solas, otra clase (C3).
El árbol cohesitivo (Figura 2) muestra nodos significativos en los niveles: 1, 11, 17 y 20, siendo el 1 el más significativo, así como una jerarquía orientada, la cual estructura los factores en varias clases que definen R-reglas.
R1: (Biomarca - Viva): es una relación de cuasiequivalencia en la cual todas las pacientes que se realizaron la determinación de los biomarcadores están vivas y viceversa (todas las vivas se determinaron los biomarcadores).
R2: (Edad - Menopau): esta es otra relación de cuasiequivalencia donde ser mayor de 50 años conlleva a estar en la etapa de la menopausia y viceversa, si la paciente está en la etapa de la menopausia es porque tiene más de 50 años.
R3: (GradoHistol - GradoNucle): esta relación de cuasiequivalencia expresa una coincidencia del grado de diferenciaron histológica con el grado de diferenciación nuclear en un sentido dicotómico, es decir no se trata de se detecte el mismo grado histológico y nuclear, sino que ambos grado sean de los clasificados como mejor o peor al mismo tiempo.
R4: (Estadio - Meta): esta cuasiequivalencia está dada porque un estadio avanzado de la enfermedad cursa con metástasis y a la inversa se puede decir que la presencia de metástasis es característico de un estadio avanzado.
R5: (R4 ⇒ Fallecido): esta metarregla plantea que el cumplimiento de la regla R4 es una condición cuasisuficiente para fallecer o según el enfoque del efecto a la causa todas las fallecidas tenían un estadio avanzado de la enfermedad y a la vez metástasis.
R6: (Desmopla - Histiocito): esta cuasiequivalencia expresa que en todas las pacientes con desmoplasia estuvo presente también la histiocitosis ganglionar o viceversa.
R7:(Quimio ⇒ Radio): al poseer una cohesión de 1, esta regla indica que todos los pacientes que recibieron quimioterapia también recibieron radioterapia.
R8: (InvNeura ⇒ TipoHistol): esta regla plantea que todos los que presentaron invasión neural tenían tipos histológicos agresivos.
R9: (Cirugía ⇒ InvAdipo): es la expresión con una cohesión máxima de que todas las operadas tenían invadido el tejido adiposo.
R10: (R3⇒ Necrosis): esta metaregla expresa que en las pacientes que se verificó el cumplimiento de la regla R3 también se presentó necrosis.
El resto de las reglas y metarreglas que se forman se interpretan de forma similar.
Con un mínimo de 97% de intensidad implicativa se logran ver todas las implicaciones entre el conjunto de variable, siendo muy evidente la magnitud de las relaciones multivariadas. También se aprecian múltiples caminos en el entramado de uniones entre variables.
Las implicaciones más significativas, con un 100% de intensidad implicativa, son:
Grado Histol → Grado Nuclea: evidencia que si se tiene un grado histológico de mal pronóstico entonces también se tendrá un grado nuclear de mal pronóstico.
Meta → Estadio: significa que si la paciente tiene metástasis entonces se encuentra en un estadio avanzado.
Biomarca → Viva: es señal de que todas las pacientes que tuvieron el resultado de los biomarcadores al momento del diagnóstico están vivas.
Menopau → Edad: significa que se produjo la menopausia en la edad biológicamente prevista.
Otras implicaciones se presentaron entre 95 y 99,99% de intensidad.
Además, se visualizan en este grafo múltiples caminos en el entramado de uniones entre variables. El camino más importante se considera el que va del tamaño tumoral mayor de 5 cm a la presencia de metástasis, con una intensidad implicativa del 98%, lo cual conllevó a un estadio avanzado de la enfermedad con la máxima intensidad implicativa y finalmente al fallecimiento de la paciente con un 99% de intensidad implicativa. (Figura 3)
El modo cono del grafo implicativo (figura 4) evidencia como factores de mal pronóstico el estadio, la metástasis, la quimioterapia y el tamaño tumoral y de buen pronóstico los biomarcadores. La metástasis y el tamaño tumoral aparece como factores pronósticos indirectos (marcado con líneas discontinuas), que al explorar en el grafo normal de la figura 3 se aprecia que ambos inciden en un estadio avanzado, la metástasis directamente y el tamaño tumoral a través de la afectación ganglionar y de la cirugía.
Al analizar las variables dependientes como variables suplementarias se identifica la contribución de vivas y fallecidas a la relación entre variables (factores pronósticos), lo cual se muestra en la tabla 1 donde se presentan los casos de cohesión máxima y se aprecia una alta contribución de las fallecidas en la formación de todas las relaciones, excepto en las relaciones entre edad y menopausia, en la cual se destacan las vivas como responsables, lo cual se corresponde con un menor valor del riesgo de clase (0,354).
Clase | Riesgo de contribución a la clase | |
---|---|---|
Fallecida | Viva | |
(Edad ⟺ Menopau) | 0,6460 | 0,3540 |
(GradoHistol ⟺ GradoNucle) | 0,3100 | 0,6900 |
(Estadio ⟺ Meta) | 0 | 1 |
(Desmopla⟺ Histiocito) | 0,3640 | 0,6360 |
(Quimio ⇒ Radio) | 0,0202 | 0,9800 |
(InvNeura⇒TipoHistol) | 0,0696 | 0,9300 |
(Cirugía ⇒InvAdipo) | 0,4050 | 0,5950 |
((GradoHistol ⟺ GradoNucle) ⇒ Necrosis) | 0,1650 | 0,8350 |
Discusión
Al confrontar con publicaciones sobre el tema, los estudios realizados por Moraga5 y Pardo6bajo la misma metodología, con el mismo objetivo y con muestras diferentes, pero de la misma población y que sirvieron como estudios piloto de este trabajo son los primeros referentes para el análisis.
El árbol de similaridad formado en este estudio no concuerda con el del estudio de Pardo6 donde se formaron 4 clases y los vivos aparecieron solos ni con el de Moraga,5 donde se aprecia una mayor diferencia entre vivas y fallecidas pues las dos clases que se forman nunca llegan a unirse, mientras que, en este estudio, como se pudo observar en la figura 1, al final se unen.
Sobre las reglas obtenidas a través del árbol cohesitivo, todas ellas fueron acertadas, excepto la sexta regla. Por ejemplo, de R1 se sabe que el conocimiento por el médico del resultado de los biomarcadores en cada paciente influye en la imposición de un tratamiento personalizado que favorece la evolución de la enfermedad. (8A partir de esta regla se desató el análisis a posteriori que constituye la 6ta etapa de esta metodología, la cual se desarrolló en Sagaró y Zamora.9
R2 refleja que la premenopausia como etapa biológica de capacidad reproductiva del ovario se corresponde con una edad menor de 50 años; por lo que estos factores deben ser equivalentes.
La regla R3 se puede calificar de acertada ya que el grado histológico estudia la formación de ductus, el índice mitótico y las características del núcleo y es precisamente este último aspecto en el que se basa el grado nuclear.10
Sobre R4 se conoce que un estadio avanzado es propio del cáncer de mama invasivo que se ha propagado más allá de la mama y los ganglios linfáticos circundantes hacia otros órganos del cuerpo, como los pulmones, ganglios linfáticos distantes, la piel, los huesos, el hígado y el cerebro.11
R5 también es acertada desde el punto de vista clínico pues como se explicó en la regla anterior la presencia de metástasis propia de un estadio terminal afecta órganos vitales con daños, en la mayoría de los casos, aspectos que llevan al paciente a fallecer.
R6 no tiene una interpretación lógica desde el punto de vista clínico, sin embargo, se puede pensar en la existencia de una variable confusora, no tenida en cuenta al diseñar el estudio, por ejemplo, podría pensarse en el estado inmunológico. Ante una regla absurda como esta, la autora sugiere identificar los sujetos típicos responsables de la formación de la misma y realizar el análisis a posteriori proponiendo nuevas variables en busca de las verdaderas relaciones de causalidad.
R7 es posible por los tratamientos combinados que se emplean en la enfermedad en correspondencia con los protocolos establecidos en cada caso y R8 también es acertada desde el punto de vista clínico pues la invasión de cualquier órgano o tejido es característico de los tipos histológicos más agresivos.12
R9 yR10 son reglas que se observan en el estudio, que no necesariamente se observan en la práctica clínica, pero tampoco se corresponden con reglas absurdas.
Sobre los factores pronósticos identificados, la presencia de metástasis y el avanzado estadio de la enfermedad fueron identificados por el análisis estadístico implicativo y la regresión como factores de mal pronóstico tanto en este estudio como en el de Pardo,6 no así en el de Moraga,5 quizás debido a que el tamaño de muestra en su estudio fue muy inferior.
En otros estudios como el de Maffuz12 de 2017, sobre mujeres mexicanas, la mayoría de las féminas diagnosticadas con cáncer de mama presentaron estadios avanzados al momento del diagnóstico (52,9% de las pacientes).
La metástasis es uno de los factores de mal pronósticos más evidenciado en muchas investigaciones, entre las que figuran la de Kim13 que encontró como el principal factor pronóstico la metástasis en ganglios linfáticos y las de Mohar-Betancourt14 y Wiltzel15 que valoran la metástasis cerebral.
Estudios como el de Kim y colaboradores 16 encontraron la quimioterapia neoadyuvante como factor de buen y mal pronóstico, respectivamente, coincidiendo el último con este estudio.
El tamaño del tumor es bien reconocido como uno de los más importantes factores pronósticos, sobre todo, en el momento del diagnóstico, es por ello que las pesquisas con mamografía son las que han permitido detectar tumores incipientes, prolongándose la supervivencia de las mujeres que padecen la enfermedad. 17
Los biomarcadores como factores de buen pronóstico está justificado en la literatura al ser sustancias que se encuentran aumentadas en el organismo, que pueden ser producidas por un tumor o el propio organismo en respuesta al tumor y aun cuando no garantizan el diagnóstico al no ser específicos, si guían en el pronóstico.Por otro lado, los biomarcadores pautan el tipo de tratamiento.9
Conclusiones
El estudio culminó con una evaluación satisfactoria de la efectividad de la metodología ASI-IMC en la identificación de posibles factores causales en las investigaciones en salud y a la vez fueron identificados los factores pronósticos de mortalidad por cáncer de mama en la población estudiada.