Introducción
El análisis estadístico implicativo, conocido por la sigla ASI de Analyse Statistique Implicative del idioma francés donde se originó, es una herramienta de la minería de datos basada en las técnicas estadísticas multivariadas, la teoría de la cuasi-implicación, la inteligencia artificial y el álgebra booleana, para modelar la cuasi-implicación entre los sucesos y variables de un conjunto de datos.1
Esta técnica surgió para solucionar problemas de la didáctica de la matemática y fue creada por el francés Régis Gras1,2,3, profesor emérito de la Universidad de Nantes, Francia, quien comenzó sus trabajos en este campo en 1980 y desde entonces ha venido estudiando el fenómeno de la creación de reglas inductivas no simétricas y de la cuantificación de la probabilidad de que se presente una cierta característica b si se ha observado otra característica a en la población.
Luego de conocer su formulación teórica los autores del presente trabajo consideraron su utilidad en los estudios de causalidad y decidieron aplicarla en la identificación de factores pronósticos de mortalidad del cáncer renal; teniendo en cuenta la necesidad del estudio de estos, Pita4) plantea que tras diagnosticar una enfermedad es de vital importancia conocer su pronóstico o predicción de la evolución de dicha enfermedad en un paciente, para en muchos casos decidir el tratamiento o realizar actividades terapéuticas y preventivas para modificar el pronóstico de la enfermedad.
Atendiendo a que el cáncer como causa de muerte ocupa el segundo lugar de forma mantenida desde el 2008 en Cuba y que es una situación sería que afecta la salud a nivel mundial, se escogió el mismo como problema de salud, en específico el cáncer renal que ha sido uno de los menos estudiados en este medio, a pesar de que en el 2017 se reportaron alrededor de 63 990 casos nuevos de cáncer de riñón y se estima que aproximadamente 14 400 personas morirán debido a esta enfermedad.5
En Cuba, se reporta una tasa de incidencia para los mayores de 20 años de 4,6 por un millón de habitantes de estas edades y una tasa ajustada por edad a la población mundial de 5,6 millones.6
Por lo antes expuesto se consideró como pregunta de investigación la siguiente: ¿Permitirá la aplicación del análisis estadístico implicativo determinar relaciones de causalidad entre los factores pronósticos del cáncer renal en pacientes atendidos en el Hospital Clínico Quirúrgico Docente “Hermanos Ameijeiras”?
Para dar respuesta a la pregunta de investigación, en este trabajo se propusieron como objetivo evaluar la utilidad del ASI en la identificación de factores pronósticos en la evolución del cáncer renal.
Método
Se realizó un estudio observacional analítico de casos y controles balanceado para identificar factores pronósticos del cáncer renal en los pacientes atendidos en el Hospital Clínico Quirúrgico Docente “Hermanos Ameijeiras” de La Habana. El período de reclutamiento se extendió de enero de 2006 a enero de 2016.
El universo de estudio quedó constituido por todas las personas mayores de 18 años atendidas en dicho hospital con el diagnóstico clínico e histológico de cáncer renal en el período de estudio, quedando el mismo dividido en casos, integrados por las 61 personas fallecidas en el período, y los controles por 282 vivos.
Para la selección de los 61 controles se aplicó un muestreo simple aleatorio, utilizando el EPIDAT para la generación de la muestra.
Se tomó como variable dependiente el estado vivo o fallecido al momento del estudio y como covariables todos los factores influyentes en el pronóstico, entre ellos edad (CEDAD), sexo (SEXO), tipo histológico (HISTO), grado de diferenciación histológica (GRADO), estadio (ETAPAC), tamaño del tumor (TTUMORAL), presencia de metástasis (META), infiltración de la cápsula renal (INFCAPSULAR), invasión vascular (PVASCULAR), parámetros de laboratorio como hemoglobina (HEMOGLOB) y LDH, tipo de tratamiento como cirugía (CIRUGIA), quimioterapia (QUIMIO) y radioterapia (RADIO).
Para recolectar la información se elaboró un formulario, el cual se llenó a partir de los datos de las historias clínicas de los pacientes vivos y fallecidos.
Para describir los factores pronósticos presentes en la población de estudio se emplearon como medidas de resumen el número y el porcentaje.
Para determinar los factores que actúan como pronósticos del cáncer renal se emplearon dos metodologías de análisis estadístico. Primeramente, se aplicó la regresión logística binaria y luego el ASI, para ello las variables politómicas se transformaron en dicotómicas. Primero se realizó un análisis clasificatorio con el propósito de agrupar factores pronósticos que reúnan características similares dentro de la colección de datos, para obtener el árbol de similaridad. Posteriormente, se calcularon las intensidades de implicación y se construyó el grafo implicativo y por último se realizó el análisis cohesitivo. La herramienta informática que posibilitó este análisis fue el software específico designado por el acrónimo CHIC (del francés: Classification Hiérarchique Implicative et Cohésitive que significa Clasificación Jerárquica, Implicativa y Cohesitiva).
Al final se compararon ambas técnicas abordando las mismas como medios diagnósticos para identificar posibles factores pronósticos. Se calculó la sensibilidad, la especificidad, valores predictivos, las razones de verosimilitud los índices de Youden, de Validez y el de Kappa para medir la concordancia entre las dos técnicas aplicadas.
Como parte de la bioética médica se tuvieron en cuenta los principios fundamentales que regulan la conducta ética médica y la aprobación del jefe provincial del programa de cáncer y los facultativos relacionados con la atención a los pacientes objetos de estudio, así como de las autoridades competentes en el centro de salud donde se desarrolló el estudio, autorizando y comprometiéndose a colaborar con el mismo.
Los datos que se obtuvieron son estrictamente confidenciales y no podrán ser utilizados con otros fines ajenos a esta investigación.
Resultados
A partir de la regresión logística binaria fueron identificados como factores de mal pronóstico, el tamaño del tumor mayor de 7 cm y valores de LDH (lactato deshidrogenasa) elevados, como posibles factores protectores la hemoglobina normal y el bajo grado de diferenciación histológica.
Con una confiabilidad del 95 %, se encontró que los pacientes con cáncer renal y tamaño del tumor mayor de 7 cm tienen entre 1 170 y 15 118 veces más probabilidades de morir que vivir que los que tienen un tamaño menor o igual de 7 cm y que los pacientes con niveles de LDH elevados tienen entre 1 004 y 1 018 veces más probabilidades de fallecer que vivir que los que no lo tienen.
También se encontró que los pacientes con hemoglobina normal tuvieron entre 0,555 y 0,960 veces menos probabilidades de morir con respecto a que los que tienen hemoglobina baja y los pacientes con un alto grado de diferenciación histológica tienen entre 0,064 y 0,794 veces menos probabilidades de morir que los que tienen menor grado, todo esto se plantea con una confianza del 95 %.
Los resultados del ASI, considerando la variable dependiente dentro de las variables principales, arrojaron que en el árbol de similaridad que se muestra en la figura 1, se forman tres grupos o clases que engloban a todos los factores.
En una de las clases se encuentra la categoría Fallecido y en otra la categoría Vivo, lo cual significa que ambas clases tienen comportamientos diferentes y cada una se asemeja a un grupo de factores diferentes. Además, se aprecia que se forman cuatro nodos significativos en los niveles 1, 6, 8, 11.
En la clase a la que pertenecen los vivos están las variables que se asocian con un mejor pronóstico supuestamente, siendo la más similar al hecho de estar vivo el grado II de diferenciación histológica con un índice de similaridad de 94 %.
En la clase de los fallecidos se forman a su vez, dos subclases:
Una primera formada por la unión de la variable fallecido y hemoglobina baja con un índice de similaridad de 95 %.
Una segunda clase formada por la unión significativa de las variables metástasis (META) y permeabilidad vascular (PVASCULAR) con un índice de similaridad de uno, que a su vez se une con la variable estadio avanzado (ETAPAC) con similaridad del 99 %, la infiltración capsular con un índice de similaridad de 99 %. Por otra parte, se observa la unión de las variables tamaño del tumor mayor de 7 cm y quimioterapia con un índice de similaridad de 99 %, y de estas con el grado III de diferenciación histológica, con una similaridad de 99 %. Esta pequeña clase se une a la anterior para formar un nodo significativo al nivel seis. Por último, estas se unen al tipo histológico más agresivo con similaridad del 99 % y radioterapia con un índice de 98 %.
En la figura 2 se muestra el grafo implicativo, del cual se puede observar la formación de dos subgrafos.
El primer subgrafo se generó a partir de un conjunto de factores que incluye la variable fallecido, en él se muestran caminos como:
C1: tener metástasis implica que los pacientes se encuentren en un estadio avanzado de la enfermedad, lo que a su vez implica tener un grado III de diferenciación histológica y de cumplirse esto el paciente tendrá infiltración capsular (todo esto con una intensidad implicativa del 99 % o más), todo lo cual implicará que los pacientes fallezcan (con una intensidad implicativa entre el 98 y el 99 %). Además, si el paciente fallece, se puede afirmar con una intensidad implicativa entre 98 y 99 % que tenía hemoglobina muy baja y, por último, niveles de LDH elevados.
C2: tener permeabilidad vascular implica, que los pacientes se encuentren en un estadio avanzado de la enfermedad, a su vez implica tener un grado III de diferenciación histológica. El camino continúa como se explicó en C1.
Observar que de los caminos C1 y C3 se derivan dos nuevos caminos C4 y C5, ya que una vez que el paciente se encuentre en un estadio avanzado de la enfermedad se puede afirmar que recibe quimioterapia, con una intensidad implicativa igual o superior al 99 %, lo cual implica, con una intensidad entre el 95 y el 96 %, que el paciente tendrá infiltración capsular y luego las implicaciones ya descritas en C1 y C2.
El segundo grafo está compuesto por un camino C10: vivo → Grado 2, teniendo una implicación directa entre las dos variables por lo que se puede plantear que el hecho de que los pacientes estén vivos implica que tienen un grado II de diferenciación histológica.
En el grafo implicativo en modo cono (figura 3) se observan factores de buen y mal pronóstico que conllevan o no, a fallecer de una forma directa e indirecta.
Dentro de ellos se encuentran implicados de forma indirecta el estadio avanzado con una intensidad de implicación del 99 % o más, el tamaño del tumor mayor de 7 cm, grado III de diferenciación histológica y de forma directa la infiltración capsular con una intensidad de implicación comprendida en el intervalo (98 %, 99 %) respectivamente. Además de forma indirecta y con una intensidad de implicación comprendida en el intervalo 95 %, 98 % se encuentran haber recibido tratamiento con quimioterapia, tener metástasis y permeabilidad vascular.
Por otro lado, indirectamente y con una intensidad del 99 %, se observa la relación implicativa entre haber fallecido y tener niveles elevados de LDH o directamente y con una intensidad de implicación comprendida en el intervalo 98 %, 99 % tener hemoglobina baja.
El árbol cohesitivo de la figura 4 muestra nodos significativos en los niveles 1, 3, 6, 8, 10 y 13, además muestra, una jerarquía orientada, la cual estructura los factores pronósticos en varias clases que definen R-reglas.
Las siguientes reglas se formaron con una cohesión o índice de cohesión de 1, siendo este el valor más alto permisible.
R1: META ( PVASCULAR, la regla plantea que, pacientes con metástasis tendrán permeabilidad vascular. De igual manera tener permeabilidad vascular implica tener metástasis.
R2: ETAPAC ( INFCAPSULAR. Esto significa que, pacientes en un estadio III o IV tendrán infiltración capsular.
R3: R1( R2, lo cual significa que de cumplirse la regla R1 se cumplirá la R2o que la regla R2es una consecuencia de la regla R1
R4: GRADO3 ( (QUIMIO ( LDH). Esta meta regla significa que ser tratado con quimioterapia implicó siempre tener niveles elevados de LDH, lo que fue implicado siempre por el hecho de tener un grado III de diferenciación histológica.
Otras reglas que se formaron con alta intensidad de cohesión entre el 90 y el 100 % sin incluir este último; se muestran en la figura 4, enmarcadas por las líneas rojas.
Del análisis comparativo entre ambas técnicas es preciso puntualizar que la regresión logística binaria identificó como factores de mal pronóstico el tamaño del tumor mayor de 7 cm y niveles de LDH muy elevados y como de buen pronóstico a la hemoglobina normal y un bajo grado de diferenciación histológica, mientras que el ASI identificó como factores de mal pronóstico, el estadio avanzado, infiltración capsular, el grado III de diferenciación histológica, el tamaño del tumor mayor de 7 cm, la presencia de metástasis, permeabilidad vascular, hemoglobina baja, niveles de LDH elevados y ser tratados con quimioterapia.
Ambas técnicas identifican los factores: tamaño del tumor mayor de 7 cm, niveles de LDH elevados y la hemoglobina baja. La regresión logística identificó un factor no identificado por el ASI y este, a su vez identificó cuatro factores no identificados por la regresión logística. Con estos resultados se conformó la tabla de doble entrada a partir de la cual se estimaron los indicadores para evaluar la efectividad del ASI. Este análisis, con un 95 % de confiabilidad, arrojó que el ASI demostró una capacidad de un 75 % para detectar las variables significativamente asociadas al cáncer renal, ya sea como factor de buen o mal pronóstico; también demostró entre un 29,64 y un 90,36 % de capacidad para identificar las variables que no constituyen factores pronósticos. Un factor pronóstico identificado por el ASI tiene una probabilidad del 43 % de serlo realmente, así mismo, una variable que no constituye un factor pronóstico según esta técnica, tiene una probabilidad del 86 % de no serlo en realidad. Con esta técnica es dos veces más probable detectar un factor pronóstico dentro de los verdaderos factores pronósticos que dentro de las variables que no lo son y clasificó correctamente al 64,29 % de las variables. Así mismo, es poco probable 0,42 % que una variable que no sea factor pronóstico salga clasificada como tal y la concordancia entre ambas técnicas fue del 49 %. La diferencia entre la tasa de verdaderos positivos y la de falsos positivos fue del 0,35 %.
Discusión
La mayoría de las personas con cáncer de riñón son de edad avanzada al momento del diagnóstico. Este cáncer es muy poco común en personas menores de 45 años. Siendo más frecuente en los hombres que en las mujeres.7) Sin embargo, en este trabajo el sexo no resultó ser un factor pronóstico.
El tener un bajo grado de diferenciación histológica resultó un factor de buen pronóstico, corroborando lo planteado en un estudio de supervivencia realizado en un hospital de España en el 2007 donde se plantea que los pacientes con grado III fueron los de peor pronóstico.8
El estudio de Giménez9) encontró como factores de mal pronóstico el estadio avanzado, la presencia de metástasis y la afectación ganglionar, coincidiendo con los resultados del ASI de este estudio, excepto en la afectación ganglionar.
Darias7 también encontró el estadio avanzado como factor de mal pronóstico lo cual coincide con los resultados del ASI, no así con los de la regresión logística.
Norman10, quien describe en su investigación los factores que predominaron en relación con la supervivencia de pacientes con cáncer renal, coincide con este estudio en que el tamaño tumoral es un factor de mal pronóstico corroborado por el ASI y la regresión logística, no así en el tipo histológico. Bengió11) también evidenció en su estudio el papel del tamaño tumoral en la evolución fatal de estos pacientes.
Shimizu12) valora más la metástasis solo demostrada como factor pronóstico en este estudio por el ASI. Aguilera13 aborda la infiltración grasa, un factor que no se tuvo en cuenta en este estudio.
En general, casi todos los estudios coinciden con este trabajo a partir de los resultados aportados por el ASI.
En cuanto a la evaluación de la efectividad del ASI este estudio mostró índices elevados que indican una buena efectividad de la técnica, similares a los encontrados en el estudio de Paez14 para determinar factores pronósticos del estado nutricional del paciente grave al egreso, el de García15 sobre identificación de factores de riesgo del cáncer de pulmón y en las series de Moraga16,17) que identifican factores pronósticos de mortalidad en el cáncer de pulmón, de mama y de próstata.
Conclusiones
Se puede destacar que el ASI identificó otros factores pronósticos no detectados con la regresión logística binaria y que con esta técnica se aprecia la relación entre todas las variables del modelo y se crean una serie de gráficos que ayudan a la mejor comprensión de los resultados obtenidos con su empleo, por lo que se reconoce que es una técnica apropiada para estos estudios que se debe complementar con la regresión logística en la identificación de factores pronósticos, lográndose una mejor comprensión de la causalidad y elevando la calidad de este tipo de investigaciones.