Introducción
La evaluación es la categoría reguladora del proceso de enseñanza aprendizaje (PEA), y uno de los aspectos más polémicos y de mayor interés en la práctica pedagógica.1
Esta constituye un proceso consustancial al desarrollo del proceso docente educativo. Tiene como propósito comprobar el grado de cumplimiento de los objetivos formulados en los planes de estudio de la educación superior, mediante la valoración de los conocimientos y las habilidades que los estudiantes van adquiriendo y desarrollando, y por la conducta que manifiestan. Representa, a su vez, una vía para la retroalimentación y la regulación de dicho proceso.2
Salas y Salas3 consideran a la evaluación como el análisis y la interpretación de los resultados de las medidas aplicadas, con la finalidad de tomar las pertinentes decisiones académicas, que conlleven a un mejor y más efectivo aprendizaje de los educandos. Es un proceso continuo a lo largo de la formación, que debe estar basado en criterios consensuados por el equipo docente, y comprometido con la competencia de los educandos, el desempeño profesoral y la calidad del currículo.
En perfecto acuerdo con Díaz y Leyva,4Quiñones y otros,5 y Gómez y otros,6 se considera este proceso como el elemento fundamental del proceso educativo, ya que redirecciona las acciones a seguir, tanto por parte del alumno como del profesor. Por ello se impone que los instrumentos de medición utilizados para tal propósito reúnan los criterios mínimos de calidad y se pongan a prueba, a efecto de que la evaluación realizada realmente refleje el aprendizaje desarrollado por cada uno de los alumnos.
Dentro de los indicadores de calidad de los exámenes escritos se trabaja con mayor frecuencia con la validez, la confiabilidad, la dificultad y la discriminación;4,5,6 los dos últimos se tuvieron en cuenta en esta investigación. La dificultad se define como proporción de personas que responden correctamente un instrumento evaluativo del total de examinados; y la discriminación, como la capacidad del instrumento para distinguir al máximo a los sujetos que tienen un alto dominio de la materia en relación con aquellos cuyo dominio es bajo o muy bajo.4,6,7
La carrera de medicina comenzó su currículo a partir del curso 2016-2017 con la implementación del Plan “D”. Bases Biológicas de la Medicina representa una de sus disciplinas y se imparte en tres semestres, es integradora y sigue la tendencia actual de las ciencias básicas biomédicas en cuanto a la unificación interdisciplinaria para tratar los problemas comunes o afines de varias ramas científicas. La asignatura Ontogenia humana y SOMA se imparte en el primer semestre de primer año e incluye los contenidos referentes al desarrollo prenatal general y el sistema osteomioarticular.8) El objetivo de la investigación fue evaluar la dificultad y discriminación del examen de la asignatura Ontogenia Humana y SOMA de la carrera de Medicina en la Facultad de Ciencias Médicas de Matanzas en los cursos 2016-2017, 2017-2018 y 2018-2019.
Métodos
Se realizó un estudio descriptivo transversal en el marco de la educación médica, para describir la estructura del examen de la asignatura Ontogenia Humana y SOMA en la Facultad de Ciencias Médicas de Matanzas en los cursos 2016-2017, 2017-2018 y 2018-2019; además, determinar la frecuencia de errores, y el nivel de dificultad y el poder de discriminación de estos.
Se seleccionó una muestra aleatoria del universo integrado por los exámenes aplicados a los estudiantes de primer año de medicina que tenían derecho al examen, de los cursos 2016-2017 (n = 280) y 2017-2018 (n = 288). En el curso 2018-2019 se trabajó con todo el universo de los exámenes (n = 364).
Como métodos teóricos se usaron el histórico-lógico, el análisis-síntesis y la inducción-deducción. En cuanto a los métodos empíricos, se realizó una revisión del programa de la asignatura y de las referencias bibliográficas actualizadas acerca del tema, que se expuso en el informe de investigación y el análisis de los instrumentos evaluativos.
Los métodos estadísticos se utilizaron para identificar el nivel de dificultad y el poder de discriminación de cada pregunta, y del instrumento como un todo. El índice de dificultad y el coeficiente de discriminación (rpbis) se calcularon a través del software de hoja de cálculo Excel de Windows XP, junto con una calculadora científica. Se trabajó con números enteros, porcentaje e índices para la presentación de los resultados en tablas.
El nivel de dificultad se expresa como índice de dificultad (p) y, de acuerdo con el criterio de diferentes fuentes consultadas, debe estar cercano a una proporción entre 0,5-0,6.4,6,7,9) Se calculó con la fórmula siguiente:
Donde:
p |
=índice de dificultad de la pregunta |
A |
=número de acierto en la pregunta |
N |
=número de aciertos más el número de errores en la pregunta |
Se distribuyeron los valores de p de acuerdo con los parámetros propuestos por Backhoff y otros9:
Altamente difícil: menos de 0,32.
Medianamente difícil: 0,32-0,52.
Dificultad media: 0,53-0,73.
Medianamente fácil: 0,74-0,86.
Altamente fácil: más de 0,86.
Para la determinación del poder de discriminación se utilizó el coeficiente de discriminación,4,6,7,9 que se calculó mediante la siguiente fórmula:4,9,10
Donde:
r pbis |
=coeficiente de correlación del punto biserial |
1 |
=media de las puntuaciones totales de aquellos que respondieron correctamente la pregunta |
0 |
=media de las puntuaciones totales de aquellos que respondieron incorrectamente la pregunta |
Sx |
=desviación estándar de las puntuaciones totales |
n1 |
=número de casos que respondieron correctamente la pregunta |
n0 |
=número de casos que respondieron incorrectamente la pregunta |
n |
=n1 + n0 |
La distribución de los resultados del coeficiente de correlación del punto biserial (rpbis), según investigaciones, se hizo de la siguiente manera:
Se realizó el análisis y la síntesis de los resultados obtenidos, así como se contrastaron con los criterios del autor los diferentes aspectos planteados en los materiales revisados. El trabajo con los datos recogidos de los exámenes se realizó sin identificación personal alguna con la finalidad de garantizar la confidencialidad, lo cual está en correspondencia con los principios establecidos para toda investigación médica en la Declaración de Helsinki.11
Resultados
La distribución de las preguntas del examen de la asignatura Ontogenia Humana y SOMA tuvo en cuenta las horas lectivas del programa de la asignatura en cada tema. En los tres cursos antes referidos el examen presentó 7 preguntas: Ontogenia Humana con 28,57 % de horas lectivas y 2 preguntas en el examen, y SOMA con 71,42 % de horas y 5 preguntas.
Las dos primeras preguntas exploraron contenidos acerca de la ciencia básica Embriología; la tercera y la cuarta pregunta, de Embriología y Anatomía, generalidades del SOMA y esqueleto cefálico y cara, respectivamente; y las tres restantes, de Anatomía, esqueleto apendicular, artrología y miología, en ese orden.
El examen aplicado en el curso 2016-2017 contó con una pregunta de selección simple, ensayo respuesta larga, de completar frases, ensayo de respuesta corta, verdadero o falso, y las restantes de ensayo. En 2017-2018 el examen presentó una pregunta de selección simple, ensayo respuesta larga, completar frases, tres preguntas mixtas y una de ensayo de respuesta corta y larga; y en 2018-2019, una pregunta de selección simple, cinco de ensayo y una de enlazar columnas. Las preguntas de ensayo predominaron en el examen aplicado en los tres cursos.
En la tabla 1 aparecen reflejadas las frecuencias de errores para cada pregunta de los exámenes y en general. Obsérvese que en el curso académico 2016-2017 las preguntas con mayores dificultades en orden de frecuencia fueron la 6, 5, 7 y 1, y el examen presentó una frecuencia de errores media; en el curso 2017- 2018 se observó que las preguntas con mayores dificultades en orden de frecuencia fueron la 3, 4, 2 y 7 y el examen alcanzó una frecuencia de errores baja; en el curso 2018-2019 se corroboró que las preguntas con mayores dificultades en orden de frecuencia fueron la 3 y 5, y el examen una frecuencia de errores alta.
En la figura aparece el número de estudiantes aprobados y desaprobados de los tres cursos en estudio.
La tabla 2 presenta la dificultad calculada a cada pregunta del examen aplicado en los cursos ya referidos y de ellos como un todo. En el caso del examen del curso 2016-2017 resultaron las preguntas de mayor dificultad la 5, 6 y 7, y la 2 se clasificó como altamente fácil. El resto de las preguntas tuvieron dificultad media. Obsérvese que en el curso 2017-2018 la pregunta de mayor dificultad resultó la 3; las preguntas 5 y 6 clasificaron como medianamente fácil; y el resto presentó dificultad media. En el caso del curso 2018-2019 la pregunta de mayor dificultad fue la 3; la pregunta 1 clasificó como medianamente fácil; y el resto tuvo dificultad media.
Se observó que la dificultad general de los exámenes fue de 0,61, 0,68 y 0,56 respectivamente, por lo que se clasificaron como exámenes de dificultad media.
La tabla 3 muestra el coeficiente de discriminación calculado para cada pregunta y para el examen general de los tres cursos. Se observó que el cálculo del coeficiente de discriminación de todas las preguntas y de los exámenes como un todo presentó discriminación excelente.
Discusión
Según Díaz y Leyva4 y Gómez y otros6 el nivel medio de dificultad del examen debe oscilar entre 0,5 y 0,6; aunque Backhoff y otros9) extienden el límite superior de este rango hasta 0,73, criterio asumido por los autores de este trabajo.
Hurtado,7Backhoff y otros,9 y Ortiz y otros12 plantean que un examen que posea dificultad media resulta superior en confiabilidad de resultados a aquellos que tengan mucha dificultad o los que resultan muy fáciles, pues da una mayor información sobre los estudiantes con dominio del contenido evaluado. Es decir, exámenes muy fáciles o muy difíciles ofrecen poco margen de discriminación, debido a que los estudiantes son igualados: en un examen muy fácil la mayoría tiene altos resultados, en un examen muy difícil la mayoría tiene muy bajos resultados. En investigaciones realizadas por Bahr y otros 13 se refiere que el índice de dificultad tiene utilidad para medir la calidad de los instrumentos evaluativos y para retroalimentar los resultados del trabajo realizado en las actividades evaluativas frecuentes, dirigidas a la preparación para las evaluaciones parciales y final.
De acuerdo con lo planteado, los resultados de esta investigación se consideran positivos y coinciden con otros estudios en asignaturas de la disciplina Morfofisiología llevados a cabo por Díaz y otros,14Blanco y otros,15) Palma y otros;16 así como en investigaciones de Quiñones y otros5) y Moreno y otros.10
La discriminación de una prueba y un ítem miden la misma habilidad, se puede esperar que, quien tuvo una puntuación alta en todo el test, deberá mostrar altas probabilidades de contestar correctamente el ítem. También se debe esperar lo contrario; quien tuvo bajas puntuaciones en el test, deberá tener pocas probabilidades de contestar correctamente el reactivo. Así, un buen ítem debe discriminar entre aquellos que obtuvieron buenas calificaciones en la prueba y aquellos con bajas calificaciones.6,7,14
Moreno y otros10 y Díaz y otros14 consideran que la forma idónea de calcular el poder de discriminación de un examen es a través del coeficiente de discriminación (rpbis). La ventaja de utilizar el rpbis en lugar del Di es que con el primer método se toman en cuenta todas las personas evaluadas, mientras que, con el segundo, solo el 54 % de ellas (27 % más alto y 27 % más bajo).
Estos resultados a través del coeficiente de discriminación, que presentó excelente discriminación, se corresponden con lo que se espera de los exámenes con una dificultad media. Los resultados coinciden con investigaciones realizadas por Ortiz y otros,12Blanco y otros15 y Sánchez y otros.17
Los indicadores de calidad estudiados alcanzaron valores satisfactorios para el examen de la asignatura Ontogenia Humana y SOMA en la Facultad de Ciencias Médicas de Matanzas en los cursos académicos estudiados. Sería importante trabajar con sistematicidad en los colectivos de asignaturas que integran la disciplina Bases Biológicas de la Medicina, ahora en el nuevo Plan “E”, para lograr el diseño de exámenes que alcancen óptimos indicadores de calidad e incorporar a estas investigaciones métodos cualitativos.