Señor Editor:
Muchos estudios en ciencias de la salud, con el objetivo de comparar las puntuaciones de una variable entre dos o más grupos (por ejemplo, sexo, nivel socioeconómico, nivel de instrucción, tipo de enfermedad, entre otras), recurren a la determinación de la existencia o no de diferencias estadísticamente significativas reportadas, fundamentalmente, a través de los valores del test de significancia de la hipótesis nula (NHST, por sus siglas en inglés), procedimiento que actualmente se encuentra en discusión.1,2 En este sentido, el NHST puede considerarse como un procedimiento insuficiente para la valoración de la importancia práctica de los resultados.
Entre las limitaciones del NHST se pueden mencionar las siguientes: considerar solo el error máximo permitido para rechazar una hipótesis nula (Ho) de ausencia de diferencias estadísticamente significativas y la alta sensibilidad respecto al tamaño de la muestra, donde muestras grandes tienden a estar asociadas también con el rechazo de la Ho.3,4,5 Ante esta situación, se hace necesario el reporte de medidas del tamaño del efecto que permiten la cuantificación de la eficacia de diferentes niveles de una variable independiente. De esta manera, de acuerdo a lo sugerido por el Comité Internacional de Editores de Revistas Médicas,6 se busca complementar la información acerca de la existencia de diferencias estadísticamente significativas (obtenida a través del NHST) con información que indique la magnitud de tales diferencias entre los grupos.
Para ejemplificar la importancia del reporte del tamaño del efecto en investigaciones de salud pública, nos basaremos en los importantes resultados de Arias y Muñoz del Carpio,7 quienes reportan la existencia de elevados niveles de agotamiento emocional, baja realización personal y despersonalización (sintomatología característica del síndrome de desgaste profesional; burnout en inglés) en una muestra de enfermeras de la ciudad de Arequipa, Perú. Los resultados ponen en relieve un problema de suma importancia para la salud pública peruana y de muchos países latinoamericanos. Entre otros importantes resultados, los autores reportan la existencia de diferencias estadísticamente significativas en el puntaje total del síndrome de desgaste profesional (p = 0,034) y la baja realización personal (p = 0,047) de acuerdo al tiempo de servicio (menos de 5 años, entre 5 a 10 años, más de 10 años).
En su artículo Arias y Muñoz del Carpio7 utilizan el análisis de varianza como procedimiento estadístico para valorar las diferencias del puntaje del síndrome de desgaste profesional y de sus dimensiones según el tiempo de servicio. Por lo que, el objetivo de la presente carta es complementar los valiosos resultados de Arias y Muñoz del Carpio proponiendo el empleo y cálculo del coeficiente omega al cuadrado (ω2) como una medida del tamaño del efecto para la comparación de más de dos grupos independientes en investigaciones de salud pública4,8 (menos de 5 años, entre 5 a 10 años, más de 10 años).
El coeficiente ω2 indica los cambios de la variable dependiente, que pueden ser explicados por los diferentes niveles de la variable independiente.8,9Ferguson y otros2 y Fritz y otros9 abordan el tema y muestran los elementos de la fórmula de ω2. Si bien existen otros coeficientes para la valoración del tamaño del efecto para comparar más de dos grupos independientes, como la eta al cuadrado (ɳ2) y la épsilon al cuadrado (ε2), el coeficiente ω2 presenta algunas bondades importantes como el no ser sensible a los cambios respecto al tamaño de la muestra, lo que sí sucede con el NHST. En este sentido, un valor de ω2 = 0,04, señala un tamaño mínimo del efecto; 0,25 hace referencia a un efecto moderado, finalmente, valores iguales o mayores a 0,64 señalan un efecto fuerte.8,9 Luego de realizar un reanálisis de la tabla 4 de Arias y Muñoz del Carpio,7) se puede plantear que los resultados tienen una interpretación diferente a la reportada por los autores.
Así, al comparar el puntaje total del síndrome de desgaste profesional (ω2 = 0,14) y la baja realización personal (ω2 = 0,12), de acuerdo al tiempo de servicio, ninguna de las diferencias son consideradas con un tamaño del efecto grande (ω2 ≥ 0,64), valor que permitiría una adecuada interpretación de la importancia práctica de los resultados.4 Más bien, los hallazgos revelan la existencia de tamaños del efecto mínimo. Así, el no reportar medidas del tamaño del efecto podría generar errores en la interpretación, como la sobrevaloración de las diferencias encontradas.
Los resultados aquí presentados exponen la importancia del cálculo del tamaño del efecto en estudios que pueden servir de base para la implementación de políticas en salud pública. Lo cual permite tener una mayor y mejor evidencia y precisión, además de brindar un significado práctico a los resultados obtenidos en busca del establecimiento de acciones de mejora de la salud y bienestar de las enfermeras de la ciudad de Arequipa (Perú).