SciELO - Scientific Electronic Library Online

 
vol.53 número1Persistencia de la producción lechera de cabras Alpinas en CubaModelo de regresión categórica para el análisis e interpretación de la potencia estadística índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Cuban Journal of Agricultural Science

versión On-line ISSN 2079-3480

Cuban J. Agric. Sci. vol.53 no.1 Mayabeque ene.-mar. 2019  Epub 26-Dic-2018

 

Biomatemática

Aplicación del Modelo Lineal Mixto y Lineal Generalizado Mixto, como alternativas de análisis en experimentos con medidas repetidas

Sarai Gómez1  *  , Verena Torres1  , Yolaine Medina1  , Yusleiby Rodríguez1  , Y. Sardiñas1  , Magaly Herrera1  , R. Rodríguez1 

1Instituto de Ciencia Animal, Apartado Postal 24, San José de las Lajas, Mayabeque, Cuba

Resumen

Se aplicaron los modelos Lineal Mixto y Lineal Generalizado Mixto a un experimento con semillas escarificadas mediante el proceso de endozoocoria, como herramientas para el procesamiento y análisis con medidas repetidas en el tiempo. Se analizaron las variables altura de la planta y grosor del tallo. Se calculó la matriz de correlación de Pearson para determinar la existencia de asociación entre los días de muestreo. En las variables analizadas, se utilizó el criterio de esfericidad mediante el estadístico de Bartlett. Para ambas variables, se comprobó el cumplimiento del supuesto de la normalidad por las dócimas de Shapiro-Wilk y Kolmogorov-Smirnov. En la variable que cumplió con el supuesto de la normalidad, se empleó un Modelo Lineal Mixto. Para la que no lo cumplió, se aplicó el Modelo Lineal Generalizado Mixto. Se analizaron las variantes de Poisson, Gamma, Log Normal, Normal y Binomial para determinar la distribución de los datos. Se probaron varias estructuras de varianza-covarianza para seleccionar la de mejor ajuste y se consideraron los criterios de información que obtuvieron los valores más pequeños. La utilización de estos modelos estadísticos permite controlar adecuadamente la probabilidad de ocurrencia del error de tipo I, pues brinda mayor flexibilidad e información al seleccionar el modelo de mejor ajuste, además de que permite analizar datos desbalanceados.

Palabras-clave: datos longitudinales; estructuras de covarianzas; criterios de información

Introducción

Uno de los métodos de investigación más utilizados es medir la variable respuesta en la misma unidad experimental en diferentes momentos en el tiempo. Estas son más eficientes que el uso de una unidad experimental diferente para cada medición, ya que requieren menos unidades, lo que reduce el tamaño de la muestra, minimiza los costos, mejora la potencia de prueba, y la estimación en el tiempo es más precisa (Kuehl 2000).

En la esfera agropecuaria se realizan, con frecuencia, experimentos con estas características. En estos estudios, no es adecuado utilizar los modelos lineales clásicos de análisis de varianza (ANAVA), pues al realizar mediciones repetidas en el tiempo en las mismas unidades experimentales, estas se hallan correlacionada. Por tanto, se incumple con los supuestos tradicionales de independencia y normalidad que se requieren para su utilización (Jerez et al. 2011 )

Dadas las características específicas que presentan estos experimentos con medidas repetidas, se trata de determinar qué estrategia analítica resulta más apropiada. Algunos autores han utilizado más recientemente los Modelos Lineales Mixtos y los Modelos Lineales Generalizados Mixtos, implementados en algunos programas estadísticos por las ventajas que presentan con respecto a los tradicionales (Balzarini and Machiavelli 2005 y Vallejo et al. 2010).

El objetivo de este trabajo fue la aplicación del Modelo Lineal Mixto y del Modelo Lineal Generalizado Mixto, como herramienta para el procesamiento y análisis de un experimento, con medidas repetidas para comparar diferentes variedades de arbóreas sometidas al proceso de endozoocoria.

Materiales y Métodos

Procedimiento experimental. El trabajo se desarrolló en el rancho “El Peregrino”, perteneciente al Campus de la Facultad de Medicina Veterinaria de la Universidad de Colima, México. En todos los casos, se utilizó semilla básica, excepto en moringa, de la que se recolectaron semillas de árboles pertenecientes al campus agropecuario de la universidad. Se probaron ocho tratamientos, que fueron Leucaena endozoocoria (Leucaena leucocephala), Coral endozoocoria (Caesealpinia platyloba), leucaena escarificada, y Coral con agua a 80 ºC (Toral y González 1999) y leucaena sin escarificar, coral sin escarificar, gliricidia sin escarificar, moringa sin escarificar (Moringa oleifera).

El proceso de endozoocoria se desarrolló con 12 becerros de la raza Brahaman, con pesos promedio de 225 kg y 18 meses de edad, estabulados en corrales independientes, que recibieron una dieta base de ensilaje de CT-115, así como 1 kg de suplemento de plátano de desecho.

A cada animal se le suministraron 1000 semillas de cada arbórea, mezcladas en el suplemento. Se determinó el consumo total de las semillas mediante oferta-rechazo. La colecta total de las heces se realizó durante 96 h a intervalos de 24 h. Las semillas recolectadas de las heces se secaron a temperatura ambiente y se depositaron en bolsas de polietileno. A partir del quinto día de recolección, se efectuó la siembra en condiciones de vivero bajo malla sombra de 50 %. Se midieron las variables altura de la planta y grosor del tallo (cm), a los 14, 21 y 28 d.

Análisis estadístico. Para las variables analizadas, se calculó la matriz de correlación de Pearson, con el propósito de determinar la existencia de asociación entre los días de muestreo. Se utilizó el criterio de esfericidad mediante el estadístico de Bartlett (1937) y la medida de adecuación muestral de Káiser- Meyer-Olkin (KMO) (Pérez y Medrano 2010 y Acosta et al. 2015).

Para ambas variables, se comprobó el cumplimiento del supuesto de la normalidad mediante las dócimas de Shapiro y Wilk (1965) y Kolmogorov -Smirnov y modificada por Lilliefors (1967). Para determinar la distribución que siguieron los datos, se empleó el Proc Severity y se analizaron las siguientes con sus correspondientes funciones de enlace Poisson (Logaritmica), Gamma (Recíproca), Log Normal (Log), Normal (Identidad) y Binomial (Logit). En ambas variables, la unidad experimental que se utilizó fue la planta. Se consideraron, como efectos fijos, los tratamientos y los días de muestreo. La interacción de ambos efectos y el error fueron los efectos aleatorios, respectivamente. Para la estimación del modelo se utilizó el método de Laplace que es el adecuado para el análisis de diseños con medidas repetidas en el tiempo.

La expresión general del modelo para ambos casos es:

Donde:

Yijk

variable respuesta esperada en estudio

µ

media común a todas las observaciones

ai

efecto fijo del i-ésimo tratamiento (i=1,…, 8)

bj

efecto aleatorio del j-ésimo tiempo (j= 14,21 y 28)

(ab)ij

efecto fijo del i-ésimo tratamiento en interacción con el efecto aleatorio del j-ésimo tiempo (ij=1, …,24)

eijk

error aleatorio asociado a todas las observaciones

Para la variable que no cumplió con el supuesto de la normalidad, se empleó el Modelo Lineal Generalizado Mixto, que coincide con el modelo descrito con anterioridad, donde Yijk= f(µ), variable respuesta, según la función de enlace específica μ= media o intercepto.

Se examinaron varias estructuras de varianza-covarianza. Entre ellas, la No estructurada (UN), Toepliz (toep), Autoregresiva de Orden 1 (Ar (1)), Simetría Compuesta (CS) y Componentes de la Varianza (CV), para obtener la de mejor ajuste. Para realizar esta selección, se acudió a los criterios de información del modelo Akaike (AIC), Akaike corregido (AICC) y Bayesiano (BIC), los que arrojaran el menor valor. Los parámetros se estimaron por los métodos de máxima verosimilitud (ML) o máxima verosimilitud restringida (REML) (Gualdrón 2009 y Vallejo et al. 2014).

Para la comparación de medias, se utilizó la dócima Kramer (1956) para P<0.05. El procesamiento de los datos se realizó con el paquete estadístico SAS (2013), versión 9.3.

Resultados y Discusión

En las tablas 1 y 2 se muestran los coeficientes de correlación para los días de muestreo en las variables altura de la planta y grosor del tallo. En ambas se obtienen valores superiores a 0.70, lo que evidencia alta correlación para cada variable entre los días de muestreo. Por tanto, no se cumplió con el supuesto de independencia de los errores.

En las tablas 3 y 4 se muestran los resultados de la prueba de esfericidad de Bartlett (1937) y la medida KMO (Kaiser 1960, (1974) para ambas variables. La esfericidad de Bartlett presentó valor significativo (P < 0.001), por lo que se rechaza la hipótesis nula de que la matriz de varianza-covarianza es una matriz de identidad. La medida de adecuación muestral de KMO fue de 0.76 y 0.74 respectivamente, ambos entre los valores establecidos como aceptables por la literatura (Salinas et al. 2014). Esto evidencia que el modelo utilizado fue el adecuado y se pudo continuar con el análisis.

Table 1 Correlation coefficients for 14, 21 and 28 d in plant height 

Table 2 Correlation coefficients for 14, 21 28 d in stem thickness variable 

Tabla 3 Sphericity test for plant height 

Table 4 Sphericity test for stem thickness 

En la tabla 5 se exponen los resultados de la prueba de normalidad, efectuados mediante los test de Shapiro Wilk y Kolmogorov Smirnov. Los residuos de la variable altura de la planta se aproximaron a una distribución normal, y se pudo emplear el Modelo Lineal Mixto. No fue así para la variable grosor del tallo, por lo que esta se analizó mediante el Modelo Lineal Generalizado Mixto, y se ajustó a una distribución Gamma con función de enlace Log.

Table 5 Normality test for plant height and stem thickness variables 

En la tabla 6 se muestran las estructuras de covarianza y los criterios de información estudiados. Para las variables altura de la planta y grosor del tallo, de todas las analizadas, solo las estructuras VC y la Ar (1) mostraron mejor comportamiento. En ambos casos, se seleccionó la VC, con valor de 445.8 y -490.7, respectivamente. La selección se basó en el criterio de información y en la estructura de covarianza que arrojó menor valor, ya que se logró mejor ajuste del modelo.

Table 6 Covariance structures and information criteria for plant height 

La tabla 7 muestra los resultados del análisis de varianza según el Modelo Lineal Mixto, en el cual la interacción días x tratamiento influyó significativamente (P<0.001) en la variable altura de la planta. Para la moringa sin escarificar, hubo mayor altura de la planta a los 28 d, sin diferir de la medición a los 14 y 21 d. La menor se obtuvo con la gliricidia sin escarificar, a los 14 d, que no difirió de lo obtenido a los 21 d, pero sí a los 28 d.

Table 7 Means of treatment per day interaction for plant height 

a,b,c,d,e Different letters indicate significant differences for P<0.05

En la tabla 8 se exponen los resultados del análisis de varianza según el Modelo Lineal Generalizado Mixto para la variable grosor del tallo, donde la interacción días x tratamientos fue significativa (P=0.0031).

En la evaluación del grosor del tallo, la moringa sin escarificar mostró los mayores valores a los 14, 21 y 28 d de muestreo, aunque no mostraron diferencias entre ellos. El coral sin escarificar mantuvo un comportamiento similar, aunque tampoco difirieron los días de muestreo entre ellos. El menor valor se obtuvo con la gliricidia en sus dos variantes. En ambas no hubo diferencias entre los días de muestreo.

Table 8 Means of treatment per day interaction for stem thickness 

a,b,c,d,e Different letters indicate significant differences for P<0.05. ( ) Estimated means for link function

Al aplicar este procedimiento, se pudo constatar el uso adecuado de alternativas estadísticas ante el incumplimiento de los supuestos del análisis de varianza, específicamente en el tratamiento de los experimentos con medidas repetidas.

Conclusiones

Los Modelos Lineales Mixtos y los Modelos Lineales Generalizados Mixtos constituyen una alternativa de análisis ante el incumplimiento de los supuestos del análisis de varianza y ante inconvenientes que presentaron los modelos clásicos en diseños con medidas repetidas.

Los criterios de información AIC, AICC y BIC permiten la selección de la estructura óptima de covarianza, lo que permite mejor ajuste del modelo.

References

Acosta, A., Mónica, M. & Sánchez, JP.2015. Desempeño psicométrico de dos escalas de autoeficacia e intereses profesionales en una muestra de estudiantes de secundaria CES Psicología, 8(2): 156-170. [ Links ]

Balzarini, M. & Macchiavelli, R. 2005. Aplicaciones de Modelo Lineal Mixto en agricultura y forestería, Notas de Clase, Curso Internacional Aplicaciones de Modelo Lineal Mixto en Agricultura y Foresteria, p.189. [ Links ]

Bartlett, M. S. 1937. Properties of sufficiency and statistical tests. In: Proceedings of the Royal Statistical Society, Series A 160 (901): 268-282. [ Links ]

Gualdrón, J. C. 2009. Influencia de los criterios de selección AIC Y BIC para la selección del modelo de evolución y la reconstrucción del análisis bayesiano. http://tux.uis.edu.Co/labsist/docencia/finales/final2009-I/2050158-20070.pdf. [ Links ]

Jerez, M., Moret, A.Y., Carrero, O.E., Macchiavelli, R.E & Quevedo, A.M. 2011. Curvas de índice de sitio basadas en Modelo Lineal Mixto para plantaciones de teca (Tectona grandis L, F,) en los llanos de Venezuela, Agrociencia, 45 (1): 135-141. [ Links ]

Kaiser, H.F. 1974. An index of factorial simplicity. Psychometrika, 39 (1): 31-36. [ Links ]

Kaiser, Η. F. 1960. The application of electronic computers to factors analysis. Educational and Psychological Measurement, 40 (20): 141-151. [ Links ]

Kramer, C.Y. 1956. Extension of multiple range tests to group means with unequal numbers of replications. Biometrics, 12(3): 307-310. [ Links ]

Kuehl, R.O. 2000. Diseño de experimentos. Principios estadísticos de diseño y análisis de investigación. Ed. Universidad de Arizona. Arizona. USA. p. 6 [ Links ]

Lilliefors, H. 1967. On the Kolmogorov-Smirnov test for normality with mean and variance unknown, Journal of the American Statistical Association, 62(318): 399-402. [ Links ]

Pérez, E.R. & Medrano, L.2010. Análisis Factorial Exploratorio: Bases Conceptuales y Metodológicas. Revista Argentina de Ciencias del Comportamiento, 2 (1): 58-66. [ Links ]

Salinas, JL., Espinosa, V., & González, HE. 2014. Características psicométricas de una escala de adherencia al tratamiento de diabetes mellitus II e hipertensión en una muestra de pacientes. Revista Electrónica de Psicología Iztacala, 17 (3): 905-929. [ Links ]

SAS. 2013. Sistema de análisis estadístico. Universidad de Nebraska. Versión 9.3. [ Links ]

Shapiro, S. & Wilk, B. 1965. An análisis of variante test for normality (complete simples) Biométrica, 52 (3): 591-611. [ Links ]

Toral, O & González, Y. 1999. Efecto del agua caliente en la germinación de diez especies arbóreas. Pastos y Forrajes, 22 (1): 47-53. [ Links ]

Vallejo, G., Arnau, J., Bono, R., Fernández, P, & Tuero, E. 2010. Selección de modelos anidados para datos longitudinales usando criterios de información y la estrategia de ajuste condicional, Psicothema, 22 (2): 323-333. [ Links ]

Vallejo, G., Arnau, J., Bono, R., Fernández, P. & Tuero, E. 2014. Selección de modelos anidados para datos longitudinales usando criterios de información y la estrategia de ajuste condicional. Psicothema , 22(2):323-333. [ Links ]

Recibido: 18 de Diciembre de 2017; Aprobado: 26 de Diciembre de 2018

Creative Commons License