Sr. Editor:
Se revisó el estudio de Rodríguez y otros,1 en el cual se llevó a cabo un minucioso análisis de la calidad de un examen parcial, aplicado a los estudiantes de odontología de la Universidad de Ciencias Médicas de Santiago de Cuba. Este análisis se basó en un enfoque observacional empleando como parámetros el coeficiente de Küder Richardson (KR20), el coeficiente α de Cronbach (α-Cronbach) y el coeficiente de correlación de Spearman (Spearman), para evaluar la consistencia del examen. El estudio concluyó que el examen obtuvo una calificación de "excelente" y se consideró que su nivel de calidad era "apropiado". También se identificó una correlación adecuada entre el tiempo asignado a cada tema y la cantidad de preguntas relacionadas con esos temas en el examen. En vista de estos resultados, se realizan algunos comentarios complementarios.
La influencia creciente del neoliberalismo en la década de los noventa, llevó a la introducción de indicadores, métricas y regulaciones en el sistema educativo, promoviendo la uniformidad y la comparación de las instituciones educativas.2 Esta creciente competencia ha impulsado la práctica constante de evaluaciones de calidad, que ahora son una parte integral de la rutina en diversas instituciones, que desarrollan y usan numerosas herramientas (como el α-Cronbach). De acuerdo con Alemañy y otros,3 valorar la calidad de un instrumento de evaluación requiere establecer su confiabilidad, que cualitativamente representa la consistencia con la que el instrumento mide una característica específica. La confiabilidad es un concepto puramente estadístico y puede expresarse mediante un factor de credibilidad o mediante la medición del error típico en las evaluaciones realizadas.
Por ejemplo, Ayala y otros4 llevaron a cabo una evaluación de un examen de ortodoncia en estudiantes de odontología de la misma universidad; demostraron falta de adecuación en la credibilidad de la evaluación y sus preguntas, ya que no se encontró una correspondencia apropiada entre los objetivos de enseñanza, el tiempo dedicado a los temas y el contenido de las preguntas, las cuales presentaban niveles variables de dificultad. Por otro lado, Münzenmayer y otros5 señalan que los métodos de evaluación aplicados en las universidades en general, promueven niveles básicos de argumentación y cognición, lo que frecuentemente resulta en que los estudiantes alcancen niveles limitados de asociación y produzcan respuestas elementales, sin potenciar sus capacidades intelectuales. Esta observación es igualmente relevante y merece ser considerada, además de la confiabilidad del examen.
Aunque un estudio de calidad de los exámenes puede validar su eficacia, es esencial recordar que el nivel de conocimiento o habilidad profesional de los estudiantes no siempre se refleja completamente en dicho instrumento. Contar con un instrumento confiable es fundamental para tomar decisiones educativas efectivas y justas. Si un examen o una evaluación carece de confiabilidad, no se pueden utilizar los resultados para orientar la enseñanza, identificar áreas de mejora o tomar decisiones en la selección de candidatos para empleo, la medición de miedo6 o la procrastinación7 en estudiantes universitarios. Sin embargo, es importante destacar que la confiabilidad no es el único aspecto a considerar. La validez, que se refiere a si el instrumento mide realmente lo que se supone que debe medir, también es fundamental. En última instancia, un buen instrumento de evaluación debe ser tanto confiable como válido.