Introducción
En las últimas décadas se ha evidenciado un aumento de la investigación cualitativa en ciencias de la salud; así, cada vez son más utilizadas las evidencias de los estudios multidisciplinares y de métodos mixtos1 en la toma de decisiones, la atención médica, las políticas de salud, la construcción de teorías y la investigación futura.2 Lo anterior, al reconocerse la necesidad de obtener una comprensión más profunda de las subjetividades humanas en torno a fenómenos salud-enfermedad, percepciones, comportamientos y demás aspectos propios de poblaciones y contextos particulares, más que únicamente las dimensiones cuantificables o experimentales.3,4
Sin embargo, aún permanece el debate sobre los estándares de rigor metodológico en la investigación cualitativa, porque es fundamental la adecuada presentación del informe de resultados para poder evaluar la calidad de dicha investigación.2,4,5 En respuesta a esta situación, han surgido varias propuestas de criterios que colaboran en su medida con la investigación cualitativa, en pro del mejoramiento para la presentación de los informes que les permita evidenciar alta calidad. Por ejemplo, algunas editoriales y revistas como BioMed Central y el Journal of Advanced Nursing han desarrollado pautas de presentación de informes para estudios cualitativos; sitios web como EQUATOR, Robert Wood Johnson6 y Joanna Briggs Institute proveen recursos relevantes para la presentación de informes de investigación y directrices para las personas que desarrollan, evalúan y participan en proyectos de investigación cualitativa en salud. Asimismo, a través del tiempo, diferentes autores han propuesto listas de criterios para la evaluación de la calidad de estudios cualitativos e informes, entre ellas se destacan, Consolidated Criteria for Reporting Qualitative Research (COREQ)2,3,4,5,6,7 y Standards for Reporting Qualitative Research (SRQR)4 al ser listas derivadas para la búsqueda y revisión de distintos aportes de esta índole.
En concordancia, COREQ, publicada en el 2007 por Tong y otros,2 es una lista de verificación para estudios que involucran entrevistas y grupos focales, desarrollada a partir de la revisión de 76 ítems identificados en 22 listas de evaluación de la calidad de estudios cualitativos se establecen 32 ítems de verificación,1,2,5,7,8 los cuales fueron incluidos por la frecuencia de reporte en las listas revisadas y agrupados en tres dominios: (i) equipo de investigación y reflexividad, (ii) diseño del estudio y (iii) análisis e informes de datos. Estos autores proponen un conjunto mínimo de indicaciones para orientar sobre el rango de dimensiones de la investigación cualitativa que requieren evaluación, como la estrategia de muestreo, el entorno y proceso para la recopilación y registro de datos, la validación de los hallazgos por parte del encuestado, la descripción de la derivación de los temas y la inclusión de citas de apoyo.2,5 Del mismo modo que existe un acuerdo generalizado sobre la necesidad de una presentación de reportes de investigación claros y completos, que permitan a la comunidad investigativa, en particular, a quienes tienen menos experiencia el evitar omisiones importantes, además de facilitar el proceso de escritura3) y evaluación crítica de los estudios cualitativos.2,4 Sin embargo, varios autores reconocen las limitaciones de estas listas de verificación, debido a la diversidad de perspectivas teóricas en la investigación cualitativa;1,5,8,9 además, se advierte no hacer una aplicación reduccionista y poco crítica de estas,6,9 dado que no hay garantía plena con el cumplimiento total del reporte de todos los elementos de estas listas de chequeo en términos de la exención de sesgos.7
Desde su publicación, COREQ se ha venido configurando como una lista de verificación de elección por parte de investigadores, autores, revisores y editores de revistas, asociada al respaldo de los journals, al considerar que su uso facilita la generación de mejores informes.7 De ahí el interés por hacer la traducción a idiomas distintos del inglés para interpretar de forma adecuada las variaciones lingüísticas y culturales;10 en la actualidad, esta lista de chequeo ha sido traducida al portugués hablado en Brasil,11 al francés hablado en Francia12 y al francés hablado en Canadá.10
Hasta el momento, no se ha referido una versión en español, por lo cual el presente estudio busca contar con este referente en habla hispana tomando como base la versión original construida en el inglés australiano para así ofrecer a los investigadores, revisores y profesionales una herramienta de evaluación de la calidad de estudios cualitativos que conduzca a mejoras en la validez e impacto de la investigación cualitativa de la salud individual y poblacional,6 tanto para Colombia como para los países cuya lengua oficial es el español en la región iberoamericana; por lo anterior, el objetivo del estudio fue desarrollar la traducción y adaptación transcultural de la lista de verificación COREQ al español.
Métodos
La adaptación transcultural es un método riguroso para obtener una equivalencia entre la lista de verificación original y la versión adaptada de esta, muchas veces diseñado en un idioma distinto al que se pretende usar. En estos procesos no basta hacer la traducción lingüística de la lista de verificación, sino es trascendental concebir la adaptación cultural para conservar la equivalencia semántica (palabras con igual significado), idiomática (modismos equivalentes), experimental (tareas de la vida diaria equiparables; Ej. comer con tenedor o palillos) y conceptual.13
Para lograr la traducción y adaptación transcultural de la lista de verificación COREQ, se obtuvo el aval escrito de Tong,2 autora principal de la publicación de esta lista (check list), para gestionar este proceso, en el presente estudio en el desarrollo se estructuraron las siguientes fases metodológicas:13,14,15,16
Fase 1- Traducción: Se generaron dos traducciones de la lista de verificación del idioma original en inglés al idioma español requerido, una de un traductor conocedor de la temática y otra de un traductor no conocedor de la temática, ambos teniendo como lengua materna el español.13,14,15
Fase 2- Síntesis: Se simplificó en una sola versión las dos traducciones, armonizando las discrepancias conceptuales generadas en los ítems, con la debida revisión del comité de expertos, conformado por el grupo investigador (n = 4), que consolidó todas las versiones y los componentes de la lista de verificación original, las instrucciones, todas las versiones traducidas y desarrolló una versión preliminar del cuestionario para la prueba piloto; después de la revisión de todas las versiones, se llegó a un consenso sobre cualquier discrepancia.4
Fase 3- Traducción Inversa: Se tomó la versión unificada en español y de esta se generaron dos retrotraducciones al idioma original inglés, ambos traductores tenían como lengua materna el inglés, con un dominio fluido del español y con conocimiento del método científico. Este proceso se hizo de forma independiente y desconociendo la versión original de la lista de verificación, con el fin de confrontar que la versión traducida reflejara el mismo contenido que las versiones originales, para asegurar una traducción consistente y descartar graves inconsistencias o errores conceptuales en la traducción, y así afirmar su calidad.13,14,15
Fase 4- Prueba piloto o preliminar: Se proyectó y aplicó a los potenciales usuarios de la versión preliminar del cuestionario, es decir, investigadores de metodologías cualitativas en salud; se buscó garantizar los planteamientos sobre la muestra para estas pruebas preliminares de Ortiz-Gutiérrez y Cruz-Avelar, quienes sugieren tener por lo menos 8 participantes,16 además de evaluar las particularidades de la versión y el contexto de aplicación. Se exploró tanto el entendimiento de los ítems como las respuestas, para lo cual se dispuso en formato de Google Forms, bajo el siguiente contenido: consentimiento informado tácito, datos de identificación y caracterización, los ítems organizados por las dimensiones de la versión prefinal (preliminar) del cuestionario con un espacio de observaciones en cada ítem y ponderándolos en escala Likert de 1 a 4 de acuerdo al grado de cumplimiento de la característica evaluada.
Los participantes cumplieron los siguientes criterios de selección: ser profesionales de la salud, ciencias sociales y humanas, con formación y/o experiencia en investigación cualitativa y que consientan su participación. La evaluación del instrumento por parte de estos investigadores se sometió a valoración del nivel de concordancia a través del coeficiente Kappa de Fleiss, coeficiente que se interpreta en un rango entre 0 a 1, con escala de interpretación de: 0 = pobre (poor); 0,10-0,20 = leve (slight); 0,21-0,40 = aceptable (fair); 0,41-0,60 = moderada (moderate); 0,61-0,80 = considerable (substantial); 0,81-1 = casi perfecta (almost perfect).17 Además del nivel de concordancia, el instrumento fue sometido a valoración de fiabilidad por medio del coeficiente Alfa de Cronbach, el cual se interpreta con valores que también oscilan de 0 a 1 así: > 0,90 excelente; > 0,80 bueno; > 0,70 aceptable; > 0,60 cuestionable; > 0,50 pobre y < 0,50 no aceptable.18)
Fase 5- Entrega: Se desarrolló la entrega y valoración de información obtenida en la prueba piloto y en las otras etapas al comité de expertos, quienes llegaron a consensos sobre la incorporación de mejoras, generación y presentación de la versión traducida, corregida y final de la adaptación transcultural de la lista de verificación en español.
Resultados
En la fase 1 (traducción) se convocó a dos profesionales con dominio del idioma inglés y español con experiencia en la traducción para validación transcultural, uno profesional de ciencias biomédicas y el otro profesional en idiomas; quienes realizaron el proceso de traducción de forma individual y cegada. En la fase 2 (síntesis) se realizó consenso entre los traductores, ejerciendo como moderador el comité de expertos compuesto por cuatro investigadoras (coautoras) con experiencia temática y dominio de los idiomas, quienes evaluaron la equivalencia semántica, conceptual y cultural para la adaptación al español. Después, se invitó a dos traductores nativos de la lengua inglesa para adelantar la fase 3 (retrotraducción) de forma individual y cegada. El comité de expertos evaluó la consistencia de la traducción descartando la existencia de errores conceptuales en la traducción y encontrando inconsistencias menores reconciliables (uso de palabras sinónimas o diferencias en redacción) (figura).
Al desarrollar estas primeras tres fases se obtuvo una versión traducida y con adaptación transcultural al español del COREQ, que conservó las equivalencias semánticas, idiomáticas, experimentales y conceptuales de la lista de verificación original en la traducción y en la retrotraducción de la lista de verificación, tras lo cual se planeó e implementó la fase 4 (prueba piloto) (figura), en la que se convocaron a 25 potenciales participantes que cumplieran los criterios de selección, obteniendo respuesta de aceptación de 13 de ellos. Después de la revisión de la calidad concebida, el comité de expertos descartó por la baja consistencia y calidad de diligenciamiento de los registros la participación de 3 personas, para un total de 10 participantes integrados a esta fase, superando así la muestra mínima proyectada en la metodología que era de 8 participantes para la prueba piloto o preliminar.16 Así, los 10 participantes en esta fase se caracterizaron por tener una edad promedio de 38,4 años (SD: 8,40), el 90 % (n = 9), género femenino, el 70 % (n = 7) con formación máxima de maestría y el restante 30 % (n = 3) de doctorado.
En la recolección y análisis de la información generada tras la evaluación realizada por los participantes en la prueba piloto a los 32 ítems, el comité de expertos examinó las
observaciones cualitativas e incorporó las mejoras pertinentes al 50 % (n = 16) de los ítems (ítems 2, 3, 4, 6, 8, 9, 12, 14, 15, 17, 18, 20, 22, 23, 25, 26), de las cuales el 43,8 % (n = 7) se relacionaron con mejoras en la redacción de los ítems y el 56,20 % (n = 9) con ejemplificar o ampliar más la explicación de los mismos (fase 5) (figura). De forma global, el 84,24 % (n = 270; N = 320) de las evaluaciones de los ítems realizadas por los participantes fueron positivas en relación a su pertinencia, comprensión y calidad.
La valoración de la concordancia de las evaluaciones realizadas por los 10 evaluadores mostró una concordancia general considerable, con un Kappa de Fleiss de 0,69, y para las dimensiones y los ítems individuales una concordancia que oscila entre moderada y casi perfecta (tabla 1). Con relación a la fiabilidad, el instrumento obtuvo, en general, un rendimiento bueno, con un Alfa de Cronbach de 0,88 y, de igual manera, al valorar este coeficiente en distintos escenarios en donde se suprime de forma independiente cada ítem; para todos los casos, la fiabilidad se mantuvo en el rango de bueno (entre 0,80 a 0,90) (tabla 1).
Tabla 1 - Valoración de concordancia y fiabilidad de la lista de verificación

*Valor de significancia estadística: valor p menor de 0,05. ** El Alfa de Cronbach de los ítems individuales es si el elemento se ha suprimido.
Fuente: Procesamiento estadístico SPSS 23 y Stata 14.
En la tabla 2 se dispone la versión final obtenida de este proceso de traducción y adaptación transcultural al español de la lista de verificación “Criterios consolidados para el reporte de investigaciones cualitativas (COREQ)”, en la cual con la debida moderación y consenso del comité de expertos se implementaron los ajustes finales, garantizando las equivalencias entre la escala original y la final.
Tabla 2 - Criterios consolidados para el reporte de investigaciones cualitativas (COREQ)
Dimensión 1: Equipo de investigación y reflexividad | ||
1. | Entrevistador / facilitador | ¿Cuál(es) autor(es) llevaron a cabo la entrevista o grupo focal? |
2. | Credenciales | ¿Cuál era la formación académica del (de los) investigador(es)? Ej. PhD, MD |
3. | Ocupación | ¿Cuál(es) era(n) la(s) ocupación(es) laborales del (de los) investigador(es) al momento del estudio? |
4. | Género |
¿Cuál era el género del investigador? Masculino: ___ Femenino: ____ Otro: ____ |
5. | Experiencia y capacitación | ¿Qué experiencia o formación tenía el investigador? |
6. | Relación establecida | ¿Antes del inicio del estudio se estableció contacto con los participantes? |
7. | Conocimiento del entrevistador por parte del participante | ¿Qué sabían los participantes acerca del investigador? Ej. Metas personales, razones para realizar la investigación |
8. | Características del entrevistador | ¿Qué características personales se informaron sobre el entrevistador/facilitador? P. ej. sesgos, suposiciones, razones e intereses en el tema de investigación |
Dimensión 2: Diseño del estudio | ||
Marco teórico | ||
9. | Orientación metodológica y teórica | ¿Qué orientación metodológica (enfoque y diseño) se estableció para sustentar el estudio? Ej. teoría fundamentada, análisis de discurso, etnografía, fenomenología, análisis de contenidos |
10. | Muestreo | ¿Cómo fueron seleccionados los participantes? Ej. de forma intencionada, por conveniencia, por muestreo consecutivo, por bola de nieve |
11. | Método de abordaje | ¿Cómo fueron contactados los participantes? Ej. Personalmente, por teléfono, por correo, por correo electrónico |
12. | Tamaño de la muestra | ¿Cuántas personas participaron en el estudio? |
13. | No participación | ¿Cuántas personas se negaron a participar o abandonaron el estudio? ¿Por qué? |
14. | Escenario de la recolección de datos | ¿En qué lugar se recolectaron los datos? Ej. en el hogar, la clínica o el lugar de trabajo. |
15. | Presencia de no participantes | ¿En el momento de la investigación, había otras personas presentes además de los investigadores y participantes? |
16. | Descripción de la muestra | ¿Cuáles son las características importantes de la muestra? Ej. datos demográficos, fecha. |
17. | Guía para la entrevista y prueba piloto | ¿Los autores generaron preguntas, recordatorios o guías? ¿Se realizó una prueba piloto? |
18. | Entrevistas repetidas | Si se realizaron entrevistas repetidas a los participantes, mencione cuántas |
19. | Registro audiovisual | ¿Se utilizó en la investigación registros de audio o video para la recolección de datos? |
20. | Notas de campo | ¿Se tomaron notas de campo (diario de campo, bitácora u otro) durante y/o después de la entrevista o el grupo focal? |
21. | Duración | ¿Cuál fue la duración de las entrevistas o de los grupos focales? |
22. | Saturación de los datos | ¿Se describió sobre la saturación de datos? |
23. | Devolución de las transcripciones | ¿Se dieron a conocer las transcripciones a los participantes para comentarios y/o correcciones? |
Dimensión 3: Análisis y hallazgos | ||
24. | Número de codificadores de datos | ¿Cuántos individuos codificaron los datos? |
25. | Descripción del árbol de codificación | ¿Proporcionaron los autores una descripción del árbol (redes, gráficos taxonómicos u otros) de codificación? |
26. | Derivación de los temas | ¿Se identificaron los temas previamente (deductivo) o se derivaron (inductivo) de los datos? |
27. | Software | ¿Qué programas informáticos, si aplica, se utilizaron para gestionar los datos? |
28. | Comprobación por los participantes | ¿Los participantes proporcionaron realimentación sobre los hallazgos? |
29. | Citas presentadas | ¿Se presentaron las citas de los participantes para ilustrar los temas/hallazgos? ¿Se identificó cada cita? Ej. el número del participante |
30. | Consistencia entre los datos y los hallazgos | ¿Existe consistencia entre los datos presentados y los hallazgos? |
31. | Claridad de los temas principales | ¿Se presentaron claramente los temas principales en los hallazgos? |
32. | Claridad de los temas secundarios | ¿Hay una descripción de los diversos casos o una discusión de los temas secundarios? |
Discusión
Por más de una década, la lista de verificación COREQ se ha posicionado entre los investigadores y revistas científicas como un referente de la evaluación de calidad metodológica y de presentación de estudios cualitativos al priorizar aspectos y detalles del equipo de investigación, métodos de estudio, contexto del estudio, hallazgos, análisis e interpretaciones.2 Si bien varios autores reconocen sus beneficios al proveer lineamientos a los investigadores para garantizar la calidad del estudio, la presentación de informes completos y transparentes, y la evaluación de estos en comunidades académicas,2,3,4 esta lista de verificación no debe usarse de forma indiscriminada o acrítica. Otros autores llaman la atención frente a la implementación descontextualizada y sin criterio de esta lista de chequeo estandarizada por parte de los investigadores como de los revisores,1,2,4,5,8,9 dado que el cumplimiento de los ítems no es sinónimo de calidad, en especial, por la calificación uniforme de estos.
Es importante enfatizar que la lista de verificación COREQ fue diseñada particularmente para estudios que ejecuten entrevistas y/o grupos focales, ofreciendo ítems específicos para esta metodología, empero de la invitación de Tong sobre su aplicabilidad para cualquier tipo de estudio cualitativo,2 es necesario evaluar su pertinencia dado el pluralismo de la investigación cualitativa.6,7,9,19) Ahora bien, Dossett afirma que, para otros diseños cualitativos, como series de casos, etnografía o investigación narrativa, no se debe aplicar COREQ, lo que pone en consideración el uso de otras escalas o listas de chequeo de acuerdo a las características específicas del tipo de estudio, enfoque teórico y la metodología de los estudios cualitativos.17
En la literatura, se identifican otras listas de verificación y estándares para la evaluación de calidad de las investigaciones cualitativas. La guía SRQR tiene como objetivo definir estándares para reportar investigaciones cualitativas con el atributo de la flexibilidad para acomodar varios paradigmas, enfoques y métodos. De la misma forma, COREQ orienta en la planeación y evaluación de los estudios.4 No obstante, SRQR al igual que COREQ también tienen limitaciones, por lo que varios investigadores se han propuesto difundir el uso de los nuevos estándares publicados para investigación cualitativa, como el Journal Article Reporting Standards for Qualitative Research (JARS-Qual) y Qualitative Meta-Analysis Reporting Standards (QMARS).5,19,20
Asimismo, se encuentran guías específicas por áreas temáticas, por ejemplo, para el ámbito educativo Guideline for Reporting Evidence-based practice Educational interventions and Teaching (GREET), publicada en el 2013 y actualizada en el 2016;21 por tipos de estudios. En el 2012, la misma autora de la lista COREQ publicó Enhancing transparency in reporting the synthesis of qualitative research (ENTREQ) como una serie de directrices para dirigir y reportar los estudios de síntesis de la investigación cualitativa, incluidas la metasíntesis, metaetnografía, síntesis temática, síntesis interpretativa crítica, síntesis narrativa y metaestudio;22 incluso se encuentran más específicas como la eMERGe para metaetnografía;23 o por tipo de diseño, para el caso de estudios mixtos como Mixed Methods Article Reporting Standards (MMARS) con recomendaciones de estándares de informes de investigaciones cuantitativas y cualitativas.19
En común, estas guías tienen como objetivo brindar lineamientos a los investigadores para informar de manera adecuada y transparente sobre el diseño y desarrollo del estudio. De igual modo, facilitar a los revisores y lectores su interpretación y la evaluación del rigor teniendo en cuenta las características específicas del enfoque y los métodos utilizados. De ahí la necesidad de realizar la traducción y adaptación al español de las diferentes herramientas para fortalecer la investigación cualitativa a nivel de Colombia y de los países de habla hispana.
Para este estudio, el proceso de traducción y adaptación transcultural se realizó en las cinco fases descritas, no obstante, en la literatura se identifican autores que han aplicado la misma metodología en otros instrumentos con algunas diferencias. Por ejemplo, adicionar un tercer traductor de idioma nativo y con dominio de la cultura e idioma extranjero para revisar ambas versiones y resolver discrepancias.24 O, como el caso de Torre y otros,25 quienes diseñaron un estudio con un total de siete fases, adicionando fases para entrevistas cognitivas y, a partir de estas, construir la versión final de la traducción desde el inglés al español rioplatense y la adaptación transcultural de un cuestionario sobre la usabilidad de la telemedicina. Otro ejemplo representativo es el estudio de Camargo y otros, donde paralelo a la traducción y adaptación transcultural, se evaluó la consistencia interna por medio de un coeficiente alfa ordinal y la validez de constructo por medio de un análisis factorial confirmatorio, procesos que requirieron de una muestra de 162 participantes en la prueba preliminar.26
Entre las limitaciones de este estudio se debe considerar que, durante la Traducción (fase 1) y Síntesis (fase 2), algunos ítems generaron confusión tanto en los traductores como en el panel de expertos, por ejemplo, el ítem 3 de la dimensión 1 sobre la ocupación o trabajo del investigador en el momento del estudio. Dado que son elementos que no tienen una adecuada explicación en relación con el objetivo y pertinencia de la pregunta para el estudio. Adicionalmente, se identificó durante la aplicación de la prueba piloto (fase 4), el número de participantes, aunque suficiente para el caso (n = 10), constituye poca disponibilidad de profesionales que cumplieran los criterios de selección ligados principalmente al perfil específico relacionado con el conocimiento y experiencia en la metodología de investigación cualitativa, además de la baja consistencia y calidad de diligenciamiento de los registros, aspectos que en conjunto limitaron el contar con una mayor contribución para el campo de este estudio.
En conclusión, se obtuvo una versión traducida y con adaptación transcultural al español de la lista de verificación Consolidated Criteria for Reporting Qualitative Research que conservó las equivalencias semánticas, idiomáticas, experimentales y conceptuales de la versión original, útil para el desarrollo de investigaciones cualitativas en salud, pues Consolidated Criteria for Reporting Qualitative Research se ha posicionado como referente de la calidad metodológica, teniendo en cuanta que su aplicación precisa ser contextualizada a la tipología y contenido de cada investigación.