Introducción
El estudio de la causalidad en las ciencias médicas siempre se ha desarrollado mediante el empleo de las técnicas estadísticas multivariadas tradicionales.1 Sin embargo, recientemente, Sagaró y Zamora propusieron el empleo del análisis estadístico implicativo con dicha finalidad, y para su aplicación eficiente elaboraron una metodología, que contextualiza este análisis en las investigaciones médicas de causalidad.2
A través del árbol cohesitivo propio de este análisis se presentan reglas y meta-reglas que describen las relaciones que se producen entre las variables incluidas en el estudio. 3-6) Lo ideal es que estas reglas se correspondan con lo que plantea la literatura y lo que se observa en la práctica médica habitual, por eso es indispensable validar el contenido de estas reglas.
La validación de la metodología se llevó a cabo mediante tres estudios, considerando en cada uno de ellos una forma diferente de validación: validación de criterio, validación de contenido y meta-análisis. 7 La validez de contenido a su vez se dividió en tres etapas. Para evaluar si la metodología está a tono con los requerimientos actuales de la investigación se empleó la validez de apariencia y para evaluar si los resultados obtenidos de su aplicación, específicamente las reglas, reflejan con veracidad lo que ocurre en la práctica médica se empleó la validez racional y el juicio de expertos. En este trabajo se presenta esta última forma de validación a través de un estudio de factores pronósticos de mortalidad por cáncer de mama.
El objetivo es evaluar la calidad de las reglas derivadas de la aplicación del análisis estadístico implicativo en una investigación médica de causalidad.
Métodos
Se realizó un estudio observacional con la aplicación de técnicas cualitativas de tipo criterio de expertos. El universo de estudio estuvo constituido por un grupo de expertos integrado por profesionales a cargo de la atención del cáncer de mama en la provincia de Santiago de Cuba con 5 años y más de experiencia y que reunieran los requisitos de un buen experto como creatividad, colectivismo y espíritu crítico.
La muestra quedó integrada por los 33 expertos de mayor puntuación entre los clasificados como muy competentes y con disposición a cooperar en la investigación, según un proceso de selección. La selección de los expertos se llevó a cabo luego de la localización y confección del listado de posibles expertos y obtención del consentimiento para su participación. Fueron considerados diferentes aspectos a los que se les otorgó determinada puntuación, en base a criterios de las autoras. No se empleó la autovaloración para calcular el coeficiente de competencia de los expertos en base a los coeficientes de conocimiento y argumentación porque en la experiencia que se posee el método provoca un aumento en la tasa de abandono de los expertos en la fase posterior de la investigación.
Para la clasificación de los expertos en la atención a pacientes con cáncer de mama se tuvieron en cuenta los siguientes aspectos, y puntuaciones por aspectos:
Los años de experiencia como especialista de cualquier nivel:
El nivel de especialización:
Especialista básico: especialista de primer o segundo grado en Medicina General Integral, Medicina Interna o Ginecobstetricia. (2 puntos)
Especialista oncólogo: especialista de primer o segundo grado en Oncología. (5 puntos)
Superespecialista: especialista de primer o segundo grado en Oncología, Medicina Interna o Ginecobstetricia que está dedicado a la investigación y atención directa de pacientes con cáncer de mama por años y por lo cual son reconocidos entre sus colegas y pacientes. (10 puntos)
Se consideraron competentes para participar en el estudio solo aquellos expertos que totalizaron 10 o más puntos. Esta indagación se hizo previo a la aplicación del instrumento y se corroboró por la respuesta del propio experto a los datos generales que pide el instrumento.
La obtención de la información se realizó de manera individual, se explicó a cada experto las características de la investigación y de la técnica evaluada, para aplicar luego una encuesta con dos preguntas, donde los expertos emitieron su juicio. El instrumento de recogida de esta información se muestra en Sagaró y Zamora. 5
Con la primera pregunta se evaluó la validez del grafo implicativo en modo cono para identificar posibles factores causales, en este caso en particular, factores pronósticos de mortalidad en cáncer de mama. En esta pregunta se le presentaron dos opciones, los factores encontrados por la regresión logística binaria y los encontrados por el ASI-IMC, respectivamente, a seleccionar la que consideraran más apropiada. A los expertos no se les dio a conocer que técnica fue la que aportó los resultados a seleccionar. Los factores presentados se tomaron del estudio de Pardo, que arrojó las mayores diferencias entre los hallazgos de cada técnica, en comparación con otros estudios de factores pronósticos en cáncer de mama realizados mediante el empleo de las dos técnicas comparadas.6
Con la segunda pregunta se evaluó la validez de las reglas que se forman con la aplicación del análisis estadístico implicativo. En ella se les presentó, mediante una escala Likert de cinco puntos u opciones de respuesta, las 23 reglas seleccionadas y se les pidió que consideraran con qué frecuencia se cumplen las mismas en la práctica médica. Los cinco puntos de la escala fueron: se cumple siempre, se cumple frecuentemente, se cumple pocas veces, casi nunca se cumple, nunca se cumple.
Para la selección de las reglas, primeramente, se acopiaron todas las reglas obtenidas a partir de los tres estudios desarrollados sobre factores pronósticos en cáncer de mama,8,9se revisaron sus interpretaciones según el enfoque del supuesto factor causal al desenlace y viceversa, y se seleccionaron 23 reglas a criterio de las autoras, teniendo en cuenta la no duplicidad y la variabilidad en los contenidos de las mismas. Algunas de las reglas escogidas verifican la misma relación, pero fueron interpretadas de manera diferente, con el objetivo de determinar cuál de las formas de interpretación es mejor entendida. Las 23 reglas estudiadas se exponen en la tabla 3 de los resultados.
Para el procesamiento de los datos, en la primera pregunta se emplearon el número y el porcentaje para totalizar cuantas respuestas fueron a favor de los resultados del análisis estadístico implicativo y cuantas a favor de los resultados de la regresión logística binaria. Para decidir si hubo diferencias significativas en la selección de una u otra opción se aplicó la prueba de diferencia de proporciones con un nivel de significación del 5 %.
La segunda pregunta se procesó por el método Delphi. A partir de las respuestas de los expertos, se conformó la tabla de frecuencias absolutas para las categorías de la escala asumida para cada una de las reglas; se determinaron las frecuencias relativas y relativas acumuladas, y se buscó la imagen de las frecuencias relativas acumuladas a través de la inversa de la función de distribución normal, para lo cual se tuvo en cuenta que eran más de 30 expertos. 10
Se calcularon los promedios por filas (P), el promedio general (N) y la diferencia entre estos (N-P). Luego se establecieron los puntos de corte que se obtienen al dividir la suma de los valores correspondientes a cada columna entre el número de reglas en este caso (promedio relativo).
Por último, se determinó la categoría o el grado de adecuación de cada regla con la opinión de los expertos consultados, que se asignó según los siguientes valores:
Los valores de N-P menores o iguales que el valor del primer punto de corte quedaron clasificados como: “Se cumple siempre”.
Los valores mayores que el valor del primer punto de corte y menores o iguales que el segundo se clasificaron como: “Se cumple frecuentemente”.
Siguiendo este procedimiento para los restantes puntos de cortes se estableció entre los puntos de corte 2 y 3 como: “Se cumple a veces”.
Entre los puntos de corte 3 y 4 como: “Casi nunca se cumple”.
Los valores mayores que el punto de corte 4 quedaron como: “Nunca se cumple”.
Una vez concluido el juicio de experto se efectuó una triangulación metodológica al comparar estos resultados con los de la validez racional, buscando la posible concordancia entre la literatura y los expertos.
Los resultados de la validez racional fueron identificados en un estudio previo, en el cual se consideraron tres categorías para clasificar la correspondencia de las reglas con la literatura: correspondencia total, cuando la literatura plantea que la regla siempre se verifica en la práctica médica; correspondencia posible, cuando la regla puede verificarse o no en la práctica médica, pero nunca resulta absurda y no correspondencia, cuando la regla nunca se verifica en la práctica médica porque es absurda.11
En la triangulación se estableció una correspondencia entre las categorías establecidas en ambos métodos, formando las tres nuevas categorías siguientes:
I: si pertenece a la categoría “correspondencia total” de la validez racional o a las categorías “se cumple siempre” y “se cumple frecuentemente” del juicio de expertos.
II: si pertenece a la categoría “correspondencia posible” de la validez racional o a las categorías “se cumple a veces” y “casi nunca se cumple” del juicio de expertos.
III. sí pertenece a “no correspondencia” de la validez racional o a “nunca se cumple” del juicio de expertos.
Se emplearon como medidas de resumen el número y el porcentaje de reglas en cada categoría y como medida del acuerdo el índice de Kappa ponderado y su significación estadística, al 5 %.
La triangulación permitió encontrar contradicciones literatura-experto que facilitaron la identificación de problemas en la redacción de las reglas, los cuales fueron reparados, pasando a la próxima ronda del juicio de expertos, en la cual se les presentó el resultado de la ronda anterior y las nuevas reglas, modificadas en su redacción. Nuevamente se procesó el juicio emitido por el método Delphi y se identificó la concordancia literatura-expertos. El criterio de parada para las rondas de expertos estuvo dado por la obtención de una concordancia excelente (superior a 0,75) entre los criterios de los expertos y lo planteado en la literatura.
Resultados
Sobre los resultados de la primera pregunta, la primera opción a escoger fue el resultado obtenido a través de la regresión logística y fue seleccionado por un solo experto, para un 3,03 %, mientras que la segunda opción se obtuvo a través del análisis estadístico implicativo y fue reconocida como la mejor por 32 expertos, lo que representa el 96,97 %. Al aplicar la prueba de diferencia de proporciones con una significación de 0,05 se hallaron diferencias significativas en la selección de los expertos, obviamente.
En cuanto a la segunda pregunta, los expertos consideraron que cerca del 74 % de las reglas se cumplen en la práctica médica siempre o frecuentemente y sólo una regla resultó absurda. En la tabla 1 se exponen las consideraciones generales sobre las 23 reglas y las categorías por estas obtenidas según el método Delphi, cuyo procesamiento se presenta en el anexo.
Se cumple siempre | 8 | 34,78 | 34,78 | 1, 2, 4, 10,16, 18, 22, 23 |
Se cumple frecuentemente | 9 | 39,13 | 73,91 | 3, 5, 11, 12,14 15, 17, 19, 21 |
Se cumple a veces | 2 | 8,70 | 82,61 | 8, 20 |
Casi nunca se cumple | 3 | 13,04 | 95,65 | 6, 7, 9 |
Nunca se cumple | 1 | 4,35 | 100,00 | 13 |
Total | 23 | 100,00 |
En la tabla 2 se aprecia la triangulación metodológica según las tres categorías establecidas para demostrar el acuerdo entre la literatura y los expertos tras la primera ronda, en la cual se muestra coincidencia en 19 reglas (82,61 %), para un índice de Kappa de 0,61 (concordancia substancial) con un valor de p muy próximo a cero (muy significativo).
Expertos | Total | ||||
---|---|---|---|---|---|
I | II | III | |||
Literatura | I | 14 | 2 | 0 | 16 |
II | 2 | 4 | 0 | 6 | |
III | 0 | 0 | 1 | 1 | |
Total | 16 | 6 | 1 | 23 |
K = 0,610 p = 0,000
En la tabla 3 se presenta el resumen de las reglas evaluadas según su correspondencia en la literatura (validez racional), el juicio de los expertos y coincidencia literatura - experto.
Regla | Correspondencia con la literatura | Opinión de los expertos | Concordancia literatura - experto |
---|---|---|---|
R1: Toda paciente que tiene metástasis está en un estadio avanzado | Total | Se cumple siempre | Si |
R2: Toda paciente que está en un estadio avanzado tiene metástasis | Total | Se cumple siempre | Si |
R3: Un mayor grado de diferenciación histológica coincide con un mayor grado de diferenciación nuclear | Total | Se cumple frecuentemente | Si |
R4: Un tamaño tumoral mayor de 5 cm conlleva a tener necrosis | Total | Se cumple siempre | Si |
R5: Una paciente que no es tributaria de tratamiento quirúrgico debe tener metástasis | Total | Se cumple frecuentemente | Si |
R6: La paciente que no recibe quimioterapia tampoco recibe radioterapia | Posible | Casi nunca se cumple | Si |
R7: La paciente que no tenga histiocitocis no debe tener desmoplasia | Posible | Casi nunca se cumple | Si |
R8: Si hay invasión perineural es porque hay invasión sanguínea | Total | Se cumple a veces | No |
R9: La invasión linfática lleva casi siempre a la necrosis | Posible | Casi nunca se cumple | Si |
R10: Con un tamaño tumoral mayor de 5 cm es posible que haya invasión sanguínea | Total | Se cumple siempre | Si |
R11: La afectación ganglionar lleva a la invasión sanguínea | Total | Se cumple frecuentemente | Si |
R12: En un estadio muy avanzado de la enfermedad no se indica hormonoterapia | Total | Se cumple frecuentemente | Si |
R13: En el período premenopáusico es probable que no haya margen quirúrgico | No | Nunca se cumple | Si |
R14: Los tipos histológicos más agresivos cursan con invasión neural | Total | Se cumple frecuentemente | Si |
R15: Las pacientes que reciben radioterapia también reciben quimioterapia | Posible | Se cumple frecuentemente | No |
R16: Hay equivalencia entre el grado nuclear y el grado histológico | Total | Se cumple siempre | Si |
R17: Las pacientes que tienen desmoplasia también tienen histiocitosis | Posible | Se cumple frecuentemente | No |
R18: Los biomarcadores son un importante factor pronóstico | Total | Se cumple siempre | Si |
R19: Las pacientes que se operan tienen invasión del tejido adiposo | Total | Se cumple frecuentemente | Si |
R20: Las pacientes que reciben quimioterapia y radioterapia tienen invasión muscular | Posible | Se cumple a veces | Si |
R21: La mayoría de las pacientes con invasión sanguínea tiene invasión ganglionar | Total | Se cumple frecuentemente | Si |
R22: Las pacientes que tienen mayores grados histológico y nuclear tienen necrosis | Total | Se cumple siempre | Si |
R23: Las pacientes que se realizan los biomarcadores reciben tratamiento hormonal | Total | Se cumple siempre | Si |
En la segunda ronda se trataron las tres reglas en las que no existió un acuerdo perfecto en la triangulación metodológica realizada en la primera ronda, por lo cual se eliminaron las reglas R6 y R7 y se modificó la redacción de R8, de “Si hay invasión perineural es porque hay invasión sanguínea” a “En los casos que hubo invasión perineural también hubo invasión sanguínea”.
En esta ronda, de las 21 reglas analizadas, el 71,43 % clasificó como que se cumple siempre y frecuentemente y se ratificó la regla 13 como absurda (Tabla 4).
Porcentaje acumulado | ||||
---|---|---|---|---|
Se cumple siempre | 8 | 38,10 | 38,10 | 1, 2, 4, 10, 16, 18, 22, 23 |
Se cumple frecuentemente | 7 | 33,33 | 71,43 | 3, 5, 11, 12, 14 , 19, 21 |
Se cumple a veces | 4 | 19,05 | 90,48 | 8, 15, 17, 20 |
Casi nunca se cumple | 1 | 4,76 | 95,24 | 9 |
Nunca se cumple | 1 | 4,76 | 100,00 | 13 |
Total | 21 | 100,00 |
En la segunda ronda se trataron las tres reglas en las que se encontró contradicción, por lo cual se eliminaron las reglas R15 y R17 y se modificó la redacción de R8: Si hay invasión perineural es porque hay invasión sanguínea por R8: En los casos que hubo invasión perineural también hubo invasión sanguínea. No fue necesario realizar otra ronda.
En la nueva triangulación realizada el acuerdo literatura- expertos fue del 90,48 % (coincidencia en 19 reglas), con lo que este acuerdo ascendió a 0,75 y se mantuvo muy significativo (Tabla 5).
Discusión
La dificultad en la comprensión de los expertos, acerca del significado de las reglas, se detectó por la contradicción en el juicio del experto, al responder de manera diferente a una misma regla, cuya interpretación fue redactada de formas diferentes. Al contrastar la correspondencia de la literatura con el juicio de los expertos se pudo seleccionar el modo más comprensible de interpretación de la regla, por ejemplo, esto sucedió con los pares de reglas equivalentes 6 - 15 (relación entre las terapias), y 7 - 17 (basadas en la relación desmoplasia-histiocitosis), donde se evidenció que la interpretación de las reglas con una redacción menos comprensible fueron la 6 y la 7, respectivamente en cada par, dada la discordancia con la literatura.
En ambos pares de reglas equivalentes, las reglas R6 y R7 tienen en común el hecho de que sus interpretaciones fueron redactadas en forma negativa, por ejemplo, “La paciente que no recibe quimioterapia tampoco recibe radioterapia”, lo cual indica que la redacción de la interpretación de las reglas en forma negativa, no debe ser empleada. Para evitar esta forma de redacción se sugiere codificar siempre, en las variables dicotómicas, la presencia de la característica analizada con el valor 1.
Otro par de reglas, donde se hizo una interpretación diferente de un mismo asunto, fueron R3 y R16, (basadas en la equivalencia entre el grado nuclear y el grado histológico) quedando mejor comprendida la regla 16. A pesar de no existir contradicción entre el juicio de los expertos y la literatura, esta diferencia se debió, posiblemente, a que la dicotomía aplicada a estas variables politómicas, cuyas categorías se agruparon en mejor y peor, no se entendió bien por los expertos.
La regla 13 resultó absurda, tanto por los expertos (en ambas rondas), como por la literatura, donde se plantea que el margen quirúrgico se relaciona con la cirugía y no guarda ningún tipo de relación con la menopausia.12 Esta pudiera ser la expresión de una variable confusora, relacionada tanto con la cirugía como con la menopausia y que debe ser incluida en el modelo.
La triangulación metodológica, mediante el contraste del juicio de expertos con la literatura, permitió evidenciar las dificultades en los enunciados de las reglas, además permitió escoger la mejor forma de redactar la interpretación de las reglas, en aquellos casos de pares de reglas con el mismo significado e interpretaciones diferentes.
El hecho de que el porcentaje acumulado de reglas en la categoría central fuera, aproximadamente, un 5 % mayor en la correspondencia con la literatura que según el juicio de expertos pudiera deberse a que los expertos se mostraron conservadores al decidir sobre la validez de las reglas.
Los estudios de Galano, Rodríguez-Pérez, Lambert, Rodríguez-Estenger y Sagaró, también hallaron resultados a favor de la validez de esta metodología.13-17Además, dos metaanálisis de 7 y 13 trabajos, respectivamente, que aplican esta metodología resumen la evidencia de su efectividad.18),(19)
Multiples estudios foráneos también corroboran la validez de estas reglas. 20-23
Las reglas obtenidas de la aplicación del ASI-IMC reflejan, en general, lo que ocurre en la práctica médica y aquellas que resultan absurdas alertan al investigador sobre un posible sesgo de confusión. Ante la presencia de reglas absurdas es importante la valoración del experto a cerca de aspectos que no resultan evidentes, por lo que el mismo siempre deberá formar parte del equipo de estas investigaciones. Otra recomendación en estos casos es realizar un análisis a posteriori, buscando nuevas variables y repitiendo el análisis para encontrar nuevas reglas que expliquen de manera satisfactoria el hallazgo.
De lo antes expuesto se concluye que esta forma de análisis está a tono con los requerimientos actuales de la investigación, las reglas obtenidas de su aplicación reflejan lo que ocurre en la práctica médica y aquellas que resultan absurdas alertan al investigador sobre posibles variables confusoras.