Introducción
La deserción estudiantil en la Educación Superior afecta a las universidades tanto desde el punto de vista académico como financiero, a los profesores, a las familias y especialmente a los propios estudiantes; por lo que debe tenerse en cuenta el impacto social que produce. El estudio de los factores que predicen y determinan la decisión de un estudiante de abandonar los estudios de una determinada carrera se ha incrementado en las últimas décadas (Kori et al. 2018; Peña Torres, 2016).
Debido a las implicaciones que tiene la deserción para la sociedad, la UNESCO ha dedicado varios de sus informes a analizar la problemática. En la III Conferencia Regional de Educación Superior para América Latina y el Caribe desarrollada en 2018, se analizó la contradicción entre el alto interés en el ingreso y la limitada atención a la deserción. En consecuencia, se derivó un Plan de Acción para el periodo del 2018 al 2028, donde una de las estrategias indicativas plantea que se debe: “Diseñar e implementar sistemas de seguimiento de estudiantes para identificar las dificultades (intra-institucionales y extra-institucionales) que llevan a la deserción temporaria o permanente” (UNESCO-IESALC, 2018, p.36).
Por otra parte, la demanda de graduados en las ramas de Ciencia, Tecnología, Ingeniería y Matemáticas (STEM, por sus siglas en inglés), ha experimentado un incremento debido al creciente desarrollo científico-tecnológico y sus aplicaciones. Sin embargo, las estadísticas recientes muestran que los índices de abandono son tan altos que no logran cubrir la demanda (Canedo et al., 2018; Korhonen y Rautopuro, 2018).
En cuanto a carreras de ciencias e ingeniería en Cuba, Núñez (2005) y Castro (2004) plantean el esfuerzo del país en la formación de profesionales de las ciencias informáticas. Teniendo en cuenta que la informatización de la sociedad beneficia la educación y una variedad de servicios en disimiles sectores, aportando mayores resultados a la economía del país; por ello la necesidad de continuar preparando personal y formando ingenieros en esta rama. Sin embargo, la eficiencia académica de estas carreras en Cuba, no supera el 40% en los últimos cursos.
Las políticas nacionales sobre el abandono estudiantil en Cuba se abordan de forma genérica y es escasa la literatura sobre el tema (Mesa, 2016; Rodríguez y Ansola, 2013). El objetivo de este estudio es determinar los factores predictivos de deserción estudiantil en la carrera Ingeniería en Ciencias Informáticas (ICI) haciendo uso del Paquete Estadístico para las Ciencias Sociales (SPSS por sus siglas en inglés), desde un enfoque de CTS. Los resultados que se presentan forman parte de la investigación doctoral de la autora y responden a la necesidad de incrementar la eficiencia del ciclo escolar y la matrícula en carreras STEM.
Los estudios sociales de la ciencia y la tecnología constituyen un campo de trabajo en los ámbitos de la investigación académica, la educación y la política pública con un enfoque general es de índole interdisciplinar. En tal sentido, en la era donde el desarrollo de la ciencia requiere de más tecnología, la sociedad encargada de llevar ambas tendrá que estar más preparada para utilizarla.
En la ciencia contemporánea es frecuente, el soporte tecnológico de buena parte de la investigación científica, el cual además influye en el curso mismo de la investigación, en lo que contará como hecho científico, en las posibilidades y modalidades de acceso y análisis de los objetos investigados. En este trabajo se trata de entender los aspectos sociales del fenómeno científico en estudio a través de la tecnología como herramienta para analizar los datos, para intentar evitar consecuencias sociales negativas.
Con el objetivo de identificar las variables a analizar en este estudio se realizó una investigación profunda de las variables consideradas por otros autores en los contextos STEM, mediante la sistematización de aportes de estudios anteriores publicados en las bases de datos Web of Science (WoS) y Scopus. Se identificaron variables de tipo:
Sociológicas: problemas financieros, laborales, personales, socioeconómicos y familiares (Salazar-Fernández et al., 2019)
Psicológicas: motivación, estrategias de estudio, emociones, intenciones y autorregulación (Korhonen y Rautopuro, 2018; Meyer y Fang, 2019; Paimin et al., 2017)
Interaccionista: sistema de evaluación, retroalimentación, apoyo para el aprendizaje. Integración académica, profesional y autoeficacia (Kori, et al., 2018)
Organizacional: métodos de enseñanza aprendizaje, forma de acceso a la universidad, pública o privada, si ha trabajado o no (Canedo, et al., 2018)
Asimismo, las variables género, edad, rendimiento académico, opción de carrera, nota promedio cuando es admitido en la universidad y lugar de procedencia, entre otras se estudian por la mayoría de los autores. A partir del este estudio se obtuvo un modelo teórico de deserción para carreras del perfil Ingeniería Informática que se describe la tesis doctoral (Lázaro, 2020) y permitieron plantear las siguientes hipótesis:
Hipótesis 1 (H1). El género, el lugar de procedencia, la opción de carrera, la fuente de ingreso y la nota en el examen de ingreso en Matemáticas, inciden en la deserción estudiantil en la carrera ICI.
Hipótesis 2 (H2). La nota de acceso en Matemática incide directamente en el rendimiento académico en Matemática y Programación.
Hipótesis 3 (H3). El rendimiento académico en Matemáticas y Programación incide inversamente en la deserción estudiantil en la carrera ICI.
Hipótesis 4 (H4). La repitencia de un año académico incide directamente en la deserción estudiantil en la carrera ICI.
Materiales y métodos
Se han planteado cuatro hipótesis correlacionales (H1, H2, H3 y H4) a fin de identificar los factores predictivos de deserción estudiantil en la carrera ICI. Las variables se han agrupado en: factores previos al ingreso a la Universidad y factores posteriores a la matrícula. Se tomó como muestra (N=485) la matrícula de primer año de la cohorte 2013-2014 en la Universidad de las Ciencias Informáticas (UCI) para realizar un estudio cuantitativo a partir de los datos de los estudiantes almacenados en diversas bases de datos institucionales, se utilizaron las siguientes variables:
Factores previos al ingreso: género, lugar de procedencia, nota en el examen de ingreso en Matemática (NEIM), la opción en que solicitó la carrera y la fuente de ingreso.
Factores posteriores al ingreso: repitencia del primer año académico, el rendimiento académico en Matemática y Programación (RAMP).
El estudio cuantitativo que se presenta incluye de forma resumida: análisis descriptivo, de correlación y de regresión logística. En primer lugar, se realiza un análisis descriptivo de las variables en estudio para inferir características de las mismas en la población, así como un análisis preliminar de la correlación existente entre las variables en estudio (Hernández-Sampieri et al., 2014). En segundo lugar, se utiliza la regresión logística con el objetivo de obtener el modelo matemático que sirva para calcular la probabilidad de que un estudiante cause baja de la institución, a partir de los valores en las diferentes variables independientes en estudio (Berlanga-Silvente y Vilà-Baños, 2014).
Los modelos de regresión logística son modelos estadísticos en los que se desea conocer la relación entre una variable dependiente cualitativa dicotómica (regresión logística binaria o binomial) y una o más variables explicativas independientes, o covariables, ya sean cualitativas o cuantitativas. También es posible analizar una variable dependiente cualitativa con más de dos valores (regresión logística multinomial).
El análisis de regresión que se utilizó para las Hipótesis 1, 3 y 4 fue la regresión logística binaria, pues la variable dependiente es dicotómica: deserción o permanencia. En el caso de la Hipótesis 2 se utilizó la regresión logística multivariada, pues la variable dependiente RAMP no es dicotómica, sino que toma tres valores como ya se ha explicado anteriormente: alto, medio o bajo.
Son varios los softwares que se utilizan por los investigadores para el desarrollo de análisis estadísticos, tales como: excel, SPSS, R, SAS (Statistical Analysis System), entre otros para análisis cuantitativos; también ATLAS.ti, NVivo, AQUAD, entre otros para análisis cualitativo de datos.
El análisis se realiza utilizando el Paquete Estadístico para las Ciencias Sociales SPSS (versión 23). Este programa permite los análisis estadísticos complejos de bases de datos de gran magnitud con una alta eficiencia. Las variables se introdujeron siguiendo el procedimiento paso a paso, en un orden lógico, según la secuencia temporal de ocurrencia; es decir, desde los atributos de preinscripción, hasta los resultados de aprendizaje en el primer año, en relación con la permanencia o deserción en el segundo.
La distribución de la muestra por géneros y situación escolar en el curso 2013-2014, o sea, estudiantes que causaron baja, repiten el primer año o promueven al segundo, se aprecia en la Figura 1. De la muestra total N= 485 de estudiantes, el 62% (299) promueve, el 18% (89) repite el primer año y el 20% (97) causa baja. La muestra seleccionada incluye estudiantes de todas las provincias del país, en correspondencia con las características de ingreso de la carrera.
Resultados y discusión
Primeramente, para analizar si existe relación entre las variables independientes y la deserción, se realizó la prueba Chi cuadrado con N=485 pues todas las variables se expresan de forma categórica. Del análisis resumido en la Tabla 1 se concluye que las variables provincia de procedencia, rango de NEIM y RAMP se relacionan con la variable deserción estudiantil. Debido a que en ellas se obtiene un valor de significación p<,05.
Nota: ** La correlación es significativa en el nivel de ,01 * La correlación es significativa en el nivel de ,05
A continuación, se muestra el resultado del análisis realizado para obtener los coeficientes de correlación por hipótesis. Se utilizó el coeficiente de correlación Rho de Spearman, pues se realiza un análisis no paramétrico con variables ordinales o de rangos, que se muestra en la Tabla 2.
** La correlación es significativa en el nivel de ,01 * La correlación es significativa en el nivel de ,05
Se infiere para la hipótesis H1 en cuanto al género, ingresan más hombres que mujeres, pero no es significativa la relación con la deserción. Igual sucede con la variable fuente de ingreso, la de mayor ingreso son los Institutos Preuniversitarios, permanece el 79% (297) y causan baja 81, que representan el 84% de todos los estudiantes que causan baja, los resultados indican que no es significativa.
Provincia de procedencia: Cinco de las nueve provincias que menos estudiantes ingresaron, tuvieron el menor porcentaje de promovidos; mientras cuatro de las seis provincias que más estudiantes ingresaron, tienen el mayor porcentaje de promovidos. Se obtuvo una correlación significativa con un nivel de significación p<,01.
Opción en que solicitó la carrera: Existe relación inversa entre esta variable y la deserción estudiantil con una significación p<,05; 170 estudiantes (35%) seleccionaron en 1ª opción, 138 seleccionaron la 2ª o 3ª (28%) y el resto entre 4ª y 10ª opción. De los 97 estudiantes que causan baja, el 42% la solicitó en primera opción, y de los 388 que permanecieron, el 39% solicitó entre la 4ª y 10ª opción.
NEIM: De los 97 estudiantes que causan baja, 52 estudiantes (54%) obtuvieron NEIM entre 60 y 69. El 66% de los que matricularon tienen por debajo de 80 en la NEIM. Existe correlación significativa con p<,01.
La hipótesis H1 se acepta parcialmente teniendo en cuenta que la provincia de procedencia, opción en que solicitó la carrera y la NEIM inciden en la deserción escolar; no siendo así, las variables género y fuente de ingreso. La hipótesis H2 se acepta ya que se obtiene r s (6) =,338**, p<,01; clasificándose como una correlación positiva media (Hernández-Sampieri et al., 2014, p.305). En la Figura 2 se muestra el resultado de la tabulación cruzada entre la NEIM y el RAMP.
Con respecto a la hipótesis H3 que relaciona las variables RAMP y la deserción estudiantil, se deduce en la Figura 3, que los 93 estudiantes que causaron baja y tienen bajo rendimiento, representan el 52% de los que tienen bajo RAMP y el 96% de los que desertaron. La correlación permite concluir que, en la medida que aumenta el rendimiento académico, disminuye la deserción estudiantil, ya que se obtiene un alto índice de correlación negativa de Spearman r s (8)= -,873**, p<,01 y N= 485.
Para la hipótesis H4 se infiere que, de los 485 estudiantes, 89 repitieron en primer año académico. De estos 89 estudiantes, 36 (40%) causaron baja durante el curso 2014-2015, o se cambiaron de carrera y 53 promovieron al segundo año. Asimismo, se comprueba que no existe relación entre dichas variables pues r s (1) =,052 con p>,05.
Del análisis anterior se puede concluir que la provincia de procedencia, la opción en que solicitó la carrera, la NEIM y el RAMP, son factores que inciden en la deserción estudiantil. Para identificar cuáles de los indicadores de estos factores son los predictivos, se describen a continuación, los resultados de un análisis de regresión logística.
La descripción del análisis de Regresión Logística (RL) se presenta por hipótesis. En la Tabla 3 se muestran los resultados de regresión logística entre las variables género, opción de carrera, fuente de ingreso, provincia de procedencia y la variable dependiente deserción estudiantil.
La RL permite obtener una función lineal de las variables independientes que permita clasificar a los estudiantes en uno de los dos grupos de la variable dependiente. De la Tabla 3 se escogen los coeficientes de RL binaria (B) para H1 que permiten obtener la función lineal del modelo de RL (Berlanga-Silvente & Vilà-Baños, 2014).
En la ecuación ecuación (1) son los coeficientes y X 1 …X k las variables que resultan predictivas.
Luego se obtiene la función logística para el cálculo de la probabilidad de que un sujeto pertenezca a una de las dos categorías binarias de la variable dependiente. En este caso, deserción o permanencia.
Los resultados del cálculo descrito en la ecuación (1) y obtenidos para la H1, teniendo en cuenta que estas son las variables con un nivel de significación por debajo de p<,05, son los que se muestran continuación:
Las variables predictivas identificadas son: la NEIM y que procedan de alguna de las provincias enumeradas como Las Tunas, Ciego de Ávila, Sancti Spíritu, Villa Clara, Pinar del Rio y Camagüey. De donde, al sustituir en la función logística dada por la ecuación (2) el valor de la ecuación (3) se obtiene que la mayor probabilidad para que un estudiante cause baja es que tenga 60 puntos en la NEIM y sea de la provincia Camagüey. Con esta ecuación se clasifica correctamente el 80% de los estudiantes.
En el caso de la hipótesis H2 se ha utilizado RL multivariada, pues la variable dependiente RAMP no es dicotómica, sino que se expresa en tres rangos: alto, medio y bajo. En este análisis se obtuvieron los resultados que se muestran en la Tabla 4; que el RAMP bajo (Yb) y medio (Ym) se pueden predecir a partir de la NEIM.
Las funciones lineales de los modelos de regresión logística obtenidos son:
Al sustituir en la ecuación (2) el valor de Y b , se infiere que la mayor probabilidad para que un estudiante tenga bajo rendimiento es que tenga la NEIM en el rango de 60 a 69, con una probabilidad del 83%.
En el análisis de la hipótesis H3, donde se relaciona el RAMP con la deserción, 93 estudiantes que causaron baja tuvieron bajo RAMP. Este resultado representa el 52% de los estudiantes que tienen bajo rendimiento y el 96% de los que causaron baja. El resultado obtenido demostró que el bajo RAMP es predictiva para la deserción. La probabilidad de que un estudiante deserte o cause baja cuando su RAMP es bajo, es del 99%. La función de regresión para esta variable es:
En el caso de la hipótesis H4 resulta que (β=20,077, p>,05); lo que indica que no es predictiva la variable repitencia del primer año para la deserción estudiantil y se rechaza la hipótesis.
El análisis de regresión realizado permitió identificar como variables predictivas de deserción estudiantil en el primer año de la carrera ICI: el RAMP, la NEIM y la provincia de procedencia. Se considera que la variable: opción en que solicitó la carrera, también se debe tener considerar predictiva porque, aunque no entró en el margen de error del 5%, no supera un error del 9%, con un valor de p=,089. Asimismo, se infiere que la NEIM puede predecir el RAMP al culminar el primer año.
Este estudio en el contexto cubano corrobora algunos resultados de estudios previos y también arroja resultados novedosos. Con respecto a la variable NEIM el resultado indica que esta es una variable muy importante tanto para el RAMP en primer año como para la deserción. Coincidiendo con los resultados obtenidos por diversos autores en otros contextos; que han estudiado estas variables, acompañadas de otras como la situación financiera, motivacional, expectativas, entre otras (Kori et al., 2018; Salazar-Fernández et al., 2019).
La variable género no resultó predictiva de la deserción en el contexto cubano, lo que no coincide con el resultado de (Miliszewska et al., 2006) en el contexto australiano. Igual ocurre en el caso de la provincia de residencia como factor predictivo. Esta variable fue estudiada por (Lacave et al., 2018) y no resultó predictiva dentro del perfil de deserción obtenido.
La variable opción de carrera se relaciona con causas motivacionales. Es una variable predictiva ya que, de cuatro técnicas cuantitativas, en tres resulta predictiva. Este resultado concuerda con los hallazgos de (Lacave et al., 2018; Meyer y Fang, 2019; Paimin et al., 2017)
La relevancia de este estudio es que aporta conocimiento científicamente probados sobre los factores predictivos de deserción en la carrera ICI, una cuestión que no se ha abordado de forma explícita en la literatura. También contribuye a elevar el conocimiento de profesores y directivos sobre dichos factores y facilitarles una propuesta de acción que se utilice en la preparación del profesorado. Presentar los resultados y discutirlos. Esto no significa explicar los resultados solamente, sino compararlos con otros criterios de expertos en la bibliografía que obtienen semejantes resultados de investigación a los que se revelan.
Conclusiones
En Cuba juegan un papel decisivo los estudios con enfoque de CTS. En este trabajo se utilizó la tecnología como herramienta para analizar datos del fenómeno científico en estudio relacionado con aspectos sociales, que nos permitió entender y aportar nuevos conocimientos. Asimismo, se considera la deserción estudiantil en la UCI una problemática que afecta no solo a la sociedad, también al desarrollo científico y tecnológico de la nación.
Los estudios sobre deserción en carreras de Ingeniería Informática son escasos, en ellos se proponen acciones institucionales para atender los factores o causas identificadas. El análisis estadístico descriptivo e inferencial utilizando correlación y regresión logística, realizado con la cohorte 2013-2014 de la UCI permitió analizar el cumplimiento o no de cuatro hipótesis correlacionales.
Se obtuvieron como variables predictivas de deserción estudiantil en el primer año: el rendimiento académico en Matemática y Programación, la nota de acceso en Matemática, la provincia de procedencia y la opción en que solicitó la carrera. Este resultado ha permitido aportar el diseño didáctico de acciones tutoriales que desde la institución y el proceso docente educativo se pueden realizar para atender estos factores. En el futuro se considera necesario profundizar el estudio mediante la inclusión de nuevas variables y la ampliación de la muestra que permita realizar comparaciones entre cohortes, facultades, planes y modalidad de estudios.