Sr. Editor
Haciendo una revisión al estudio de Bernal y González1) que tiene como objetivo la validación del Environmental Stress Questionnaire como alternativa de evaluación en el ámbito de la enfermería, identificamos que el estudio utiliza el procedimiento de validez de contenido, contando con jueces expertos con amplio conocimiento teórico y metodológico en el tema de evaluación, quienes valoraron la idoneidad entre los ítems y las variables evaluadas, desde el punto de vista temático e idiomático.2) Si bien el estudio utiliza el índice de concordancia simple y el índice modificado de Lawshe, estos no son suficientes como medidas objetivas para valorar el grado de coincidencia entre los jueces expertos en relación a los ítems evaluados.2) Así, esta carta tiene como objetivo proponer el empleo del coeficiente V de Aiken y sus intervalos de confianza, como medida para la cuantificación del acuerdo entre los jueces.2,3,4
La V de Aiken, permite la cuantificación de la validez de contenido, a partir del análisis, que realiza un número determinado de jueces, de la importancia de un ítem respecto a una característica que se está evaluando,4 a partir de la siguiente fórmula matemática:
Donde es el promedio de las calificaciones de los jueces; l es la puntuación más baja que es posible obtener y k es la diferencia entre el mayor y menor puntaje que es posible obtener. La puntuación obtenida oscila entre 0 y 1, donde valores cercanos a la unidad indican un mayor grado de acuerdo entre los jueces. Teniendo en consideración la influencia del error muestral y la necesidad de poseer un indicador de la utilidad práctica de los valores obtenidos, se sugiere también el cálculo de los intervalos de confianza (IC), los cuales permiten una interpretación más precisa de los valores de la V de Aiken.4) En este sentido, diversos autores sugieren la siguiente fórmula para el cálculo de los IC:2,4,5
Para el límite inferior:
Para el límite superior:
Donde L es el límite inferior y U, el límite superior; n es la cantidad de jueces; k es la diferencia entre el mayor y menor puntaje que es posible obtener; V es el valor de la V de Aiken; y z es la distribución estándar elegida (90 %, 95 % o 99 %). Gracias al cálculo de los IC es posible obtener evidencia empírica para determinar si el valor obtenido de la V de Aiken es mayor al valor mínimo aceptable para concluir que el contenido de un ítem es representativo o no de la variable a evaluar.2,4,5) Algunos autores consideran adecuado un valor de 0,70 a más como límite inferior de los IC.2,4) La ausencia de algunos datos en los artículos antes citados imposibilitan realizar un análisis complementario de la V de Aiken y sus intervalos de confianza. Así, a modo de ejemplo, un valor de V de Aiken de 0,78 y un límite inferior de su IC de 0,66, menor al mínimo recomendado, permitiría concluir que no habría suficiente evidencia para determinar la validez de contenido del ítem analizado, haciendo necesaria su revisión.2
Por todo lo mencionado, se sugiere el cálculo de la V de Aiken y sus IC en estudios como el Bernal y González.1) La falta de rigurosidad en el análisis de la validez de contenido puede afectar etapas posteriores del estudio,2) más aún si los instrumentos son empleados para el diagnóstico individual o de procesos, estudios de tipo epidemiológico o como base para la formulación de políticas en salud pública.