Introducción
Las extremidades superiores son necesarias para realizar actividades básicas o complejas por lo que su afección limita a una persona para el desempeño de sus tareas cotidianas.1 En Colombia, las enfermedades musculoesqueléticas de miembros superiores se encuentran entre las primeras causas de pérdida de capacidad laboral.2
En las áreas de la salud es común el uso de instrumentos con fines de tamizaje y diagnóstico. Una de las escalas que permite la valoración integral de miembros superiores como unidad funcional es el DASH (Disability Arm Shoulder And Hand),3,4 pues detecta, cuantifica y diferencia los cambios en la extremidad; por ejemplo, posibilita observar la respuesta al tratamiento en pacientes con trastornos musculoesqueléticos, antes y después de una intervención quirúrgica.5
El DASH tiene una versión abreviada (Quick DASH) que mantiene las propiedades instrumentales del original con la capacidad del efecto general (ES) y media de respuestas estandarizadas (SRM) similares. Gracias a su síntesis en 11 preguntas, mejora el desarrollo y tiempo de respuesta.6,7 Es recomendable para uso en ambiente clínico y de investigación porque asegura la habilidad de discriminar y detectar cambios en su aplicación.7
Esta escala se ha adaptado transculturalmente con buena fiabilidad y validez y se utiliza, ya sea en su idioma original (inglés) o validada en otros idiomas, en estudios de Reumatología, Traumatología, Ortopedia y procesos de rehabilitación.4 Este instrumento logra posicionarse como una herramienta estándar para establecer el progreso de las intervenciones en mano, codo y hombro.8,9
La escala DASH, en sus versiones en español, se ha validado en trastornos musculoesqueléticos tras el manejo quirúrgico de algunas patologías y en la valoración de mujeres con cáncer de mama. Se correlaciona con instrumentos como el FACT-B4 (excepto bienestar/social familiar), SF-36 (excepto rol emocional) AUSCAN, m- SACRAH y Cochin. La versión a utilizar y su uso para valorar la funcionalidad de los miembros superiores dependerán de los objetivos de la medición.
Aunque es muy usada en la valoración de las funciones de las extremidades superiores y pese al bajo costo que genera su aplicación, no se cuenta con una revisión que permita conocer el tipo de población en la que se aplica ni los países en los que ha sido certificada, y al mismo tiempo es difícil ubicar las versiones en español. Esto conlleva a que en regiones como Latinoamérica no se emplee lo suficiente. Sin embargo, contar con este tipo de cuestionarios, que se encuentran validados en español y son confiables, es importante para países con bajos recursos y poca inversión en salud como Colombia,10 donde han aumentado significativamente las enfermedades que afectan los miembros superiores, entre ellas el cáncer de mama.11,12
Es importante que los profesionales que utilizan la escala DASH en procesos de investigación, en la evaluación de las intervenciones quirúrgicas y en la toma de decisiones diagnósticas y terapéuticas cuenten con los resultados de los procesos de validación; por consiguiente, esta revisión tuvo como objetivo consolidar algunos procesos de certificación realizados a la escala DASH en idioma español.
Métodos
Se realizó una búsqueda, sin restringir la fecha de inicio y hasta el 31 de agosto de 2020, en las bases de datos PubMed, ClinicalKey, SciELO, Science Direct, Epistemonikos y Google con las palabras claves DASH, validación, extremidad superior y fiabilidad, en los idiomas español, inglés y portugués. Dentro de los criterios de inclusión se consideraron las investigaciones disponibles que legitimaran las versiones del DASH en español.
Una vez identificadas las publicaciones en las diferentes bases de datos, se procedió a seleccionarlas por título y resumen, fueron excluidas las que no correspondían con los procesos de validación o evaluación de la fiabilidad de la escala DASH en idioma español o trataban de escalas diferentes. Finalmente se realizó una búsqueda cruzada a través de las referencias de algunos de los estudios incluidos inicialmente y se encontraron siete validaciones en idioma español de la escala DASH.
Estructura de la escala DASH
El DASH es un cuestionario auto-administrado, compuesto por una estructura teórica unifactorial y se basa en aspectos físicos, sociales y psicológicos.13
Este instrumento se compone de 30 ítems generales y dos módulos específicos opcionales que evalúan la afectación que tiene el miembro superior para tocar instrumentos musicales, llevar a cabo algún deporte o trabajar, según algunos síntomas como el dolor, la rigidez o la pérdida de fuerza.14 La valoración del cuestionario sería inadecuada si se quedan sin responder más del 10 % de las preguntas.15 Cada ítem se califica de 1 a 5 según la intensidad de los síntomas: 1 es sin dificultad y 5 corresponde a dificultad severa.8
Para obtener la puntuación total del cuestionario se debe sumar la calificación de los ítems; esta puntuación oscila entre 30 y 150 puntos y se transforma en una escala de 0 (mejor puntuación posible) a 100 (peor puntuación posible).4 Se evalúa también en excelente (< 20 puntos), buena (20-39 puntos), regular (40-59 puntos) y mala (60-100 puntos); a mayor puntaje, más alta es la discapacidad.16 En la siguiente ecuación, n corresponde al número de respuestas completadas. Los módulos opcionales se califican a parte y con el mismo procedimiento.8
Este instrumento puede encontrarse en versiones aprobadas por el Institute for Work & Health en el siguiente enlace: https://dash.iwh.on.ca/. Asimismo, se puede acceder al cuestionario DASH y realizarlo de manera digital en https://www.orthotoolkit.com/dash/. Su uso es libre para personal de salud e investigadores que lo utilicen con fines no comerciales, en caso contrario se requiere el pago de una licencia.
En la revisión se incluyeron un total de siete estudios realizados en cinco países; tres en España, dos en Colombia, uno en México y otro en Puerto Rico. Seis de ellos validaron la versión completa de la escala DASH y uno la versión corta, a partir de los siguientes tipos de validación: contenido, de criterio, de constructo, longitudinal y convergente (tabla 2). Fue utilizada en pacientes con manejo quirúrgico, población con cáncer de mama, patologías osteomusculares y pacientes sanos. Se sometió a procesos de evaluación de fiabilidad,3,4,7,15,18,19) validez de contenido,4,18 validez de constructo3,4,15,17 y validez de criterio.3,4,7
La consistencia interna fue calculada a través de estadísticos como el coeficiente de correlación de concordancia de Lin y el Alfa de Cronbach que se empleó para evaluar la precisión transversal. La reproducibilidad se estimó a través del test-retest y la precisión longitudinal con el cambio mínimo detectable (CMD).
Instrumento | Población y tamaño de muestra | Análisis principales | Conclusión |
---|---|---|---|
DASH, versión completa. MT Hervás/ España.4 | 98 pacientes con afecciones como tendinitis de hombro, síndrome subacromial, fracturas de antebrazo, codo, húmero y escápula. |
Fiabilidad. Reproducibilidad. Validez de contenido. Validez de constructo. Validez de criterio. Capacidad de respuesta. |
Alfa de Cronbach de 0,96. Prueba test-retest con r = 0,96. Practica ausencia de efecto techo y suelo para el DASH (0,99 % y 0,00 %, respectivamente). Relación DASH - comorbilidad (p = 0,018) y DASH - situación laboral (p < 0,001). Correlación entre DASH y las de las diversas dimensiones del SF-36. Dolor (r = -0,69) y función física (r = - 0,51). f) ES y SRM> 0,80. |
DASH, versión completa. RS Rosales/ España.17
|
42 pacientes con diagnóstico de síndrome del túnel carpiano. |
Capacidad de respuesta comparada con medidas del examen físico. Validez de constructo. Hipótesis: DASH presenta un nivel de respuesta superior al SF-36 e inferior al CTQ. |
DASH: ES = 0,68 y SRM 1,00.
a) Mejor respuesta del DASH al compararlo con medidas clínicas: ES desde 0,00 (pellizco de llave) hasta 0,30 (tiempo de destreza). SRM desde 0,00 (pellizco de llave) hasta 0,35 (tiempo de destreza). b) DASH presentó mejor respuesta SF-36 e inferior a CTQ. SF-36bp: ES = 0,07, SRM = 0,08. SF-36rp: ES = 0,14, SRM = 0,12. CTQ-SS: ES = 1,41, SRM = 1,75. CTQ-EF: ES = 0,7, SRM = 0,51. |
DASH, versión completa. AL Mulero-Portela/Puerto Rico.15 | 44 mujeres con diagnóstico de cáncer de mama que se sometieron a cirugía. |
Fiabilidad evaluada a través de la consistencia interna. Validez de constructo. Se correlacionó DASH con FACT-B. |
Alfa de Cronbach: 0,97 y correlaciones de ítem a total fueron moderadas en un rango de 0,44 a 0,85. Correlación con la mayoría de las subescalas del FACT-B (r > 0,47), excepto una (bienestar social/familiar, r = 0,096). |
DASH, versión completa. R Arreguín Reyes/ México.18 | 10 sujetos sanos y 16 con enfermedad reumática. |
Fiabilidad evaluada a través de la consistencia interna. Validez de contenido Correlación m- SACRAH, AUSCAN y DASH y con Cochin. |
Alfa de Cronbach > 0,950. CCI = 0,921 (p = 0,0001). Sustitución de 5 palabras al español mexicano. Buena correlación del DASH con m- SACRAH (0,779, p = 0,000), Cochin (0,862, p = 0,000) y AUSCAN (0,889, p = 0,000). Adecuada capacidad discriminatoria en participantes con afección leve vs moderada a grave y efecto techo suelo con tendencia a puntajes bajos. |
DASH, versión completa. AB Puentes Gutiérrez/ España.19 | 65 mujeres con linfedema secundario a tratamiento de cáncer de mama, en fase estable de la enfermedad. 51 de ellas en test-retest. | a) Fiabilidad analizada a través de la consistencia interna y test re-test. b) Validez convergente: correlación con las características sociodemográficas, antropométricas, clínicas e instrumentos que evalúan CVRS: SF-36v2 Y FACT-B4. |
a) Alfa de Cronbach de 0,962 (IC 95% = 0,969 - 0,972). CCI: de 0,861 (IC 95% = 0,763-0,919). b) Menor grado de linfedema cuanto menor fue la puntuación del DASH (p = 0,033). Correlación con el IMC (r = 0,488, p = 0,000). Correlación con el SF-36v2, sobre todo en los dominios de función física, dolor corporal y rol físico (r = -0,800, -0,738, -0,682 respectivamente, p = 0,000). Correlación alta con FACT-B4 (r = -0,816, p = 0,000). |
DASH versión completa. LA García Gonzáles/ Colombia.3 | 331 pacientes: 38 en test-re-test, 66 en estimación de la respuesta al cambio y 81 en la validación de criterio. Padecían síndrome del túnel carpiano y tenosinovitis de Quervain. |
Fiabilidad mediante test re-test con coeficiente de Lin. Precisión transversal con EEM, basado en el coeficiente Alfa de Cronbach. Precisión longitudinal a través del CMD, basado en el coeficiente de Lin. Respuesta al cambio. Consistencia interna con Alfa de Cronbach. Validez de constructo con análisis factorial. Validez de criterio. Correlación entre DASH y el SF-12aV2. |
Coeficiente de Lin de 0,86 (IC 95% = 0,76 - 0,95). EEM = 8,49. CMD = 15,88. SRM de 0,86 y ES 0,99. También se identificó correlación moderada entre los cambios en la puntuación del DASH y la EVA de dolor con r = 0,62 (p < 0,001) y entre DASH y EVA de cambio en estado de salud con r = 0,5668 (p < 0,001). Alfa de Cronbach de 0,96 para los 30 ítems de la escala. Se identificaron 4 dominios: movilidad de hombro y fuerza, actividades manuales, síntomas y autoimagen y carga de un objeto pesado. Correlación entre DASH y la esfera física del SF-12aV2 con r = -0,5676 (p < 0,001) y con la esfera mental con r = -0,3787 (p < 0,001). |
DASH versión corta (Quick-DASH). LA García Gonzáles/ Colombia.7 | Participaron 298 pacientes con síndrome del túnel carpiano y tenosinovitis de Quervain: 38 en test re-test, 66 en estimación de respuesta al cambio y 75 en la validación de criterio. |
Fiabilidad. Precisión transversal con EEM, basado en el coeficiente Alfa de Cronbach Precisión longitudinal a través del CMD, basado en el coeficiente de Lin. Respuesta al cambio. Consistencia interna con Alfa de Cronbach. Validez de criterio. Correlación entre DASH y el SF-12aV2. |
Correlación con el DASH fue de 0,97. a) Coeficiente de concordancia de Lin: 0,8 (IC 95% = 0,67 - 0,93). b) EEM95 = 12,72 c) CMD95 = 20. d) SRM de 1,62 y ES 1,27. También se identificó correlación moderada entre los cambios en la puntuación del DASH y la EVA de dolor con r = 0,025 (p < 0,001) y entre DASH y EVA de cambio en estado de salud con r = 0,5668 (p < 0,001). e) Alfa de Cronbach > 0,9197 para los 11 ítems de la escala. f) Correlación entre DASH y la esfera física del SF-12aV2 con r = -0,653 y con la esfera mental con r = -0,303. |
SF-36: cuestionario de salud SF-36; SF-36v2: versión en español del cuestionario SF-36; SF-36bp: subescala de dolor corporal del cuestionario SF--36; SF-36rp: subescala del rol físico del cuestionario SF-36; SF -12aV2: versión en español del SF-12 (12 preguntas); ES: tamaño del efecto; SRM: respuesta media estandarizada; CTQ: El cuestionario del túnel carpiano; CTQ-SS: subescala de severidad de los síntomas del CTQ; CTQ-SF: subescala de estado funcional del CTQ; FACT-B: cuestionario para la evaluación funcional de la terapia del cáncer de mama; FACT-B4: FACT-B + subescala del brazo (4 preguntas); m-SACRAH: puntuación modificada para la valoración y cuantificación de la afección reumática crónica de las manos; AUSCAN: índice australiano/canadiense de osteoartritis de la mano; Cochin: escala de función de la mano de Cochin; CVRS: calidad de vida relacionada con la salud; EVA: escala visual análoga; IMC: índice de masa corporal; CR: coeficiente de relación; CCI: coeficiente de correlación intraclase; EEM: error estándar de la medición; CMD: cambio mínimo detectable; IC 95%: intervalo de confianza del 95%.
Validez de contenido
Arreguín Reyes primero sometió el instrumento de evaluación a dos Comités que sugirieron sustituir cinco palabras no comunes en el español mexicano. Posteriormente, realizó una prueba piloto en sujetos sanos que debían notificar si comprendían las preguntas y respuestas del cuestionario traducido al español, además debían referir si eran confusas y si tenían observaciones frente a la escala; luego los expertos realizaron las correcciones pertinentes al estudio.18) García González confirmó la validez con la aplicación del cuestionario DASH a expertos en cirugía de mano, hombro y medición.3
Hervás evaluó la eficacia de contenido al comparar los porcentajes de casos con valores máximos (efecto techo) y mínimos (efecto suelo) del DASH y el SF-36 que obtuvo considerable efecto techo en las dimensiones función física (20,79 %), rol emocional (56,43 %) y rol social (21,78 %); efecto suelo para las dimensiones rol funcional (70,29 %) y rol emocional (22,77 %) y escaso efecto techo en sus dimensiones dolor, salud general, vitalidad y salud mental. Para el DASH los valores techo y suelo fueron casi inexistentes: un solo paciente (en la segunda medición) obtuvo la mejor puntuación, sin embargo, ninguno tuvo la peor. Estos hallazgos, sumados a la amplia variabilidad de los puntajes, señalan que esta herramienta puede detectar variaciones en la medida que el paciente mejora o empeora.4
Validez de constructo
Hervás analizó si los factores del paciente se relacionaban con peores puntuaciones en el DASH y solo hubo diferencias estadísticamente significativas en relación con la situación laboral y la presencia de comorbilidades.4Rosales encontró que el DASH tiene buen nivel de respuesta a las 12 semanas en el síndrome del túnel carpiano, con un ES de 0,68 y un SRM de 1, con mayor sensibilidad al cambio que el examen físico, el SF-36rp y SF-36bp, pero menor que el CTQ que es específico para esta patología.17
Mulero-Portela utilizó coeficientes de correlación de rangos de Spearman en su estudio con pacientes de cáncer de mama y correlacionó la escala DASH con FACT-B. La correlación fue de regular a moderada (los valores oscilaron entre 0,096 y 0,682) con todas las subescalas del FACT-B excepto en bienestar social/familiar.15
Por su parte, Puentes Gutiérrez observó la relación del DASH con las características sociodemográficas, antropométricas, clínicas e instrumentos que evalúan CVRS: SF-36v2 y FACT-B4. Se obtuvo como resultado que a menor linfedema (p = 0,033) y menor índice de masa corporal (r = 0,488, p = 0,000), menor puntuación en la escala DASH (mayor funcionalidad). En cambio, hubo alta correlación del DASH con el SF-36v2, principalmente en los dominios de función física, dolor corporal y rol físico (r = -0,800, - 0,738, -0,682 respectivamente) y una correlación inversa alta con FACT-B4 (r = -0,816, p = 0,000), sin correlación con la subescala social/familiar (r = -0,193, p = 0,216).19
García González hizo un análisis factorial a la versión completa e identificó cuatro dominios: movilidad de hombro y fuerza, actividades manuales, síntomas y autoimagen y carga de un objeto pesado. Para validar la escala por severidad y de forma longitudinal se estudiaron pacientes con problemas de la mano y del hombro; se esperaba encontrar puntuaciones mayores (mayor limitación) en el segundo grupo y, por tanto, discriminar entre gravedad de enfermedades y niveles de compromiso funcional. Sin embargo, cuando se compararon las puntuaciones iniciales con las del postratamiento (12 semanas), no se encontraron diferencias importantes en los puntajes de pacientes con lesiones de mano o de hombro (p = 0,6) y sí entre las puntuaciones previas y posteriores al tratamiento.3
Validez de criterio
Hervás correlacionó las puntuaciones del DASH y las dimensiones del SF-36. La mayoría fueron significativas (p < 0,001), principalmente el dolor (r = -0,69) y la función física (r = -0,51).4 Para Arreguín Reyes la relación del DASH con m- SACRAH (0,779, p = 0,000), Cochin (0,862, p = 0,000) y AUSCAN (0,889, p = 0,000) es buena; mantiene adecuada capacidad discriminatoria en participantes con afección leve vs moderada a grave y el efecto techo suelo tiene tendencia a puntajes bajos.18
García González comparó la calificación de la versión completa del DASH con el cuestionario SF-12aV2 a través de Spearman y determinó una correlación aceptable con la esfera física (-0,5676, p < 0,001) y pobre con la mental (-0,3787, p < 0,001).3 La misma evaluación fue realizada al Quick-DASH, e igualmente se obtuvo una correlación aceptable con la esfera física (-0,653) y pobre con la mental (-0,303).3
Consideraciones sobre la Escala DASH
La escala DASH ha sido utilizada principalmente en trastornos musculoesqueléticos, tras el manejo quirúrgico de algunas patologías y en la evaluación de mujeres con cáncer de mama. Por medio de exploraciones funcionales, enriquece la valoración en este tipo de enfermedades, favorece su adecuado manejo y la toma de decisiones diagnósticas y terapéuticas. Además permite evaluar la evolución y efectividad del tratamiento para determinar el impacto de la enfermedad sobre las estructuras y la función del miembro superior.4
Respecto al proceso de validación de los estudios incluidos en la revisión, la mayoría evaluó la fiabilidad, la validez de contenido, de constructo y de criterio a través de la comparación con otras herramientas como SF-36 (evalúa calidad de vida), FACT-B (evaluación funcional en cáncer de mama), CTQ (cuestionario del túnel carpiano), AUSCAN, m- SACRAH y Cochin (funcionalidad de la mano); se exluyeron los componentes emocionales comprendidos en algunas de estas. Hervás menciona que de acuerdo con los objetivos que se persigan con la medición, se hará la elección del instrumento. Añade que el SF-36 pueden no ser un buen comparador pues no es específico para evaluar miembros superiores.4
Respecto a la fiabilidad, se evaluó la estabilidad que es la obtención de resultados similares al aplicar un mismo instrumento en repetidas ocasiones; esto se considera un requisito previo para realizar procesos de validación,21 pues otras propiedades se pueden ver comprometidas por la inestabilidad en las mediciones.
En los procesos de validación de contenido, se obtuvieron buenos resultados y en algunos se incluyeron pruebas piloto. La certificación de contenido se relaciona con la claridad, la pertinencia y la suficiencia de los instrumentos. Ayuda a que el participante resuelva el cuestionario más fácilmente; esto unido a la correctas instrucciones de administración e interpretación favorece la uniformidad y la precisión en las mediciones.22
Los procesos de validación de constructo demuestran que el DASH identifica diferencias entre los sujetos, según sus características clínicas, la severidad de la afección y los cambios en el tiempo.3,4,7) Esto es útil no solo para procesos de caracterización sino también para realizar seguimiento y control a intervenciones.
La validación de criterio determina que si los objetivos de la medición están encaminados a una patología específica, como el síndrome del túnel del carpo, se debe optar por utilizar CTQ que fue diseñado para ese fin,17 pero si se necesita conocer la capacidad funcional de los miembros superiores, el DASH es la opción indicada.5
Respecto a las recomendaciones de los investigadores sobre los procesos de validación, se destaca la propuesta de Mulero-Portela que a parte de la música no incluye otras artes escénicas y señala que dos ítems de la versión original evalúan en una misma pregunta lavarse y secar el cabello.15) La primera recomendación se considera adecuada por la variedad de manifestaciones artísticas que existen y pueden involucrar extremidades superiores. En cuanto a la segunda, es importante tener en cuenta que ambas acciones implican un grado de complejidad y de agarre diferente, además se manipulan objetos de diferentes pesos. Estas dos propuestas deben analizarse detenidamente para que la medición sea más precisa.
Algunos autores consideran que se puede utilizar el Quick-DASH porque conserva las propiedades psicométricas del original.3,18) Sin embargo, el uso de la versión completa (DASH) o la versión corta (QUICK-DASH) dependerá de las necesidades del profesional, o sea, si se requiere información más detallada, completa y evaluar lesiones proximales de los miembros superiores es preferible el DASH, pero cuando se valoren gran número de casos, el tiempo disponible sea corto y la lesión sea distal de las extremidades superiores, se sugiere el QUICK-DASH.7
Dentro de las limitaciones de esta revisión, se destaca que no fue posible acceder a algunas versiones completas del DASH y se incluyeron solo artículos en inglés, portugués y español. También es posible que se incurra en sesgo de selección porque se realizó con un segundo calificador. No obstante, estos aspectos no invalidan los hallazgos y pueden incorporarse en investigaciones similares para mejorar la calidad de la selección de los estudios a incluir.
Respecto a la metodología de revisión narrativa, la información científica que se brinda es variable pues depende de la experiencia de los autores. Algunos han mencionado que este tipo de revisiones generan una evidencia baja al no tener una estructura exacta ni evaluar la calidad metodológica.23 Mas esta revisión puede ser una herramienta de aproximación para personas que quieran realizar investigaciones o utilizar las versiones del DASH en idioma español.
Conclusiones
Teniendo en cuenta lo anteriormente expuesto, se recomienda el uso de la escala DASH en sus dos versiones para evaluar los miembros superiores por sus resultados de validez y fiabilidad. Ha reportado buena consistencia interna y se considera un instrumento claro, pertinente e idóneo con buena sensibilidad al cambio; además su implementación es ideal para países con escasos recursos o poca inversión en el sistema de salud por ser una técnica muy económica.
Para evaluar patologías específicas, como el síndrome del túnel del carpo, se propone elegir otras herramientas. Se sugiere realizar más investigaciones que utilicen versiones en español del DASH para que puedan verificarse sus propiedades psicométricas en diferentes poblaciones, principalmente en países latinoamericanos como Colombia, donde se cuenta con poca evidencia al respecto.