SciELO - Scientific Electronic Library Online

 
vol.54 issue2Probiotic potential of Lactobacillus salivarius in animals of zootechnical interestLigninolytic potential of Curvularia kusanoi L7 laccases for animal production author indexsubject indexarticles search
Home Pagealphabetic serial listing  

My SciELO

Services on Demand

Journal

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


Cuban Journal of Agricultural Science

Print version ISSN 0864-0408On-line version ISSN 2079-3480

Cuban J. Agric. Sci. vol.54 no.2 Mayabeque Apr.-June 2020  Epub June 01, 2020

 

BIOMATEMÁTICA

Propuesta del modelo lineal mixto y generalizado mixto para el análisis de un experimento de la microbiología del rumen

Magaly Herrera Villafranca1  * 
http://orcid.org/0000-0002-2641-1815

Juana Galindo Blanco1 
http://orcid.org/0000-0001-8639-4693

C. Padilla Corrales1 
http://orcid.org/000-0002-6794-8694

Caridad W. Guerra Bustillo †2 

Yolaine Medina Mesa1 

Lucia Sarduy García1 

1Instituto de Ciencia Animal, Apartado Postal 24, San José de las Lajas, Mayabeque, Cuba.

2Universidad Agraria de La Habana (UNAH) Fructuoso Rodríguez Pérez, Carretera Tapaste y Autopista Nacional, km 23 1/2. San José de Las Lajas, Mayabeque, Cuba.

Resumen

El trabajo tiene como objetivo proponer el modelo lineal mixto y generalizado mixto para el análisis de un experimento de la microbiología del rumen. Para el desarrollo de la investigación, se usaron datos de un estudio desarrollado en el Departamento de Ciencias Biofisiológicas del Instituto de Ciencia Animal. Se evaluó el efecto de diferentes procedencias y/o variedades de Moringa oleifera en la población microbiana ruminal. Se aplicó un diseño completamente aleatorizado, asociado a un modelo de análisis de varianza simple, con arreglo factorial 6x3. Se establecieron 18 tratamientos, que estuvieron relacionados con las procedencias o variedades de Moringa oleífera y tres horarios, cada uno con seis repeticiones. Se verificaron los supuestos teóricos del análisis de varianza para las variables originales homogeneidad y normalidad de los errores. Cuando se incumplieron, se utilizó como alternativa de análisis el modelo lineal generalizado mixto y, en caso contrario, el lineal mixto, con ayuda del procedimiento GLIMMIX y MIXED del SAS. En ambos modelos, se consideraron como efectos fijos tratamiento, hora e interacción tratamiento por hora, y como aleatorio, la repetición anidada dentro de horas. Los resultados mostraron que el cuadrado medio del error fue menor, cuando se utilizaron los procedimientos mixtos. También disminuyeron los errores estándar, lo que contribuye a mayor precisión en los resultados. Desde esta perspectiva, se proponen estos modelos para el análisis de variables relacionadas y experimentos de conteo en la población microbiana del rumen.

Palabras clave: GLIMMIX; supuestos del análisis de varianza; efecto anidado

El análisis de varianza paramétrico es el método estadístico más difundido en el análisis de datos, desarrollado por Fisher en la década de los años 20 del siglo pasado. Sin embargo, para su utilización es necesario el cumplimiento de los supuestos teóricos. Entre ellos, que los errores se distribuyan de forma normal e independiente, que sus varianzas sean homogéneas, además de considerar la aditividad del modelo. Cuando alguno de estos supuestos teóricos falla, se sugiere el empleo de otros métodos de análisis, entre los que se encuentran los modelos lineales mixtos (MIXED) y generalizados mixtos (GLMMIX).

Los modelos mixtos, según Dicovskiy y Pedroza (2017), son una propuesta de modelación estadística avanzada, que permiten mejorar la calidad del análisis de los factores fijos y factores aleatorios, al modelar la variabilidad aleatoria y la correlación de los errores. Son muy útiles en el análisis de datos desbalanceados, datos con algún tipo de estructura jerárquica. Por tanto, permiten estimar la variabilidad entre grupos y la de los efectos anidados dentro de grupos.

Nelder y Wedderbum (1972) agrupan diferentes modelos estadísticos, los que dieron a conocer como lineales generalizados (MLGnz), que constituyen una extensión de los lineales generales clásicos (MLG). Estos modelos se pueden aplicar a distribuciones de tipo normal, binomial, Poisson, gamma, entre otras (Mandujano et al. 2016, Díaz et al. 2017 y Monterubbianesi 2017).

Wang et al. (2015) plantean que los datos que se miden en las investigaciones agrícolas no satisfacen las premisas de los modelos lineales generales, por lo que los modelos lineales generalizados mixtos proporcionan una vía de análisis que no requiere necesariamente distribución normal de las variables, al posibilitar que estas se puedan ajustar a una distribución de la familia exponencial.

Estos modelos han sido muy difundidos en las ciencias sociales, en la psicología y en las ciencias médicas. Sin embargo, en las agropecuarias han tenido poca aplicación, sin tener en cuenta que, en muchas ocasiones, están involucradas situaciones en las que es difícil utilizar el MLG en los análisis de varianza y regresión. Y esto es porque las variables que se analizan no cumplen los supuestos de normalidad, homogeneidad de varianza e independencia de los errores, por lo que se pueden proponer estos modelos como alternativa de análisis.

A partir de lo antes expuesto, se identificó como objetivo proponer el modelo lineal generalizado mixto en el análisis de un experimento de la microbiología del rumen.

Materiales y Métodos

Para la investigación se utilizaron los datos de un experimento desarrollado en el Departamento de Ciencias Biofisiológicas, del Instituto de Ciencia Animal. El presente estudio tuvo como objetivo evaluar el efecto de diferentes variedades de Moringa oleifera y Cynodon nleumfuensis (pasto estrella) en la población microbiana ruminal, para lo que se midieron las variables bacterias totales y ácido isovalérico. El experimento se conformó en un diseño completamente aleatorizado, con arreglo factorial 6 x 3. Los factores fueron las seis variedades de pastos y los tres horarios, con seis repeticiones cada uno. Las mediciones no se realizaron sobre la misma unidad experimental. Los modelos estadísticos que se utilizaron fueron los siguientes:

Modelo lineal generalizado mixto:

E(y)=μ=g1(Xβ)

Donde:

E(y)

- valor esperado de la variable respuesta (conteo de bacterias totales y ácido isovalerico)

- predictor lineal (combinación lineal de un parámetro desconocido β.

g

- función de enlace, que pertenece a un miembro de familias exponenciales de distribuciones de probabilidad.

Modelo lineal mixto.

yij= = µ + αi+ βj+ α βij+ eij

Donde:

yijk

- variable respuesta

μ

- media general a todas las observaciones

αi

- efecto fijo del i-ésimo pasto (i=1, …,6)

βj

- efecto fijo del j-ésima hora (j=1,…,3)

(α β)ij

- efecto fijo del i-ésimo pasto en interacción con el efecto fijo del

j

- ésima hora (ij=1, …,18)

eik

- error aleatorio asociado a todas las observaciones

Se verificaron los supuestos teóricos del análisis de varianza para las variables originales. Para la homogeneidad de varianza de los tratamientos, se usó la dócima de Levene (1960). La normalidad de los errores se evaluó mediante la dócima de Shapiro-Wilk (1965). En este análisis, la variable bacterias totales incumplió con ambos supuestos, y después de transformada no mejoró su cumplimiento. La variable original ácido isovalérico sí cumplió con estos supuestos, por lo que no fue necesario realizar la transformación de los datos.

Para la variable que incumplió con los supuestos teóricos de análisis de varianza, se aplicó como alternativa de análisis el modelo lineal generalizado mixto, con ayuda del procedimiento GLIMMIX. Cuando se cumplieron los supuestos teóricos del análisis de varianza, se utilizó el modelo lineal mixto, con ayuda del PROC MIXED, ambos del SAS. En los análisis estadísticos se consideraron como efectos fijos los tratamientos, las horas y la interacción tratamientos por horas. Como efecto aleatorio se consideró la repetición anidada dentro de horas. Para la variable bacterias totales, se probaron las distribuciones normal, Poisson, lognormal y gamma, siendo esta última la de mejor ajuste, con función de enlace log.

Se probaron las estructuras de varianza-covarianza Toeplitz (Toep), componente de varianza (VC), simetría compuesta (CS), autoregresiva de orden 1 (AR[1]) y no estructurada (UN). Para seleccionar la de mejor ajuste a los datos, se utilizaron los criterios de información [Akaike (AIC), Akaike corregido (AICC) y Bayesiano (BIC)], que se consideró el valor más pequeño. Para la comparación de medias, se utilizó la dócima de rango fijo (Kramer 1956). Los datos se analizaron con el paquete estadístico SAS (2013), versión 9.3.

Resultados y Discusión

En la tabla 1 se muestra el análisis de los supuestos teóricos normalidad de los errores y homogeneidad de varianza para las variables que se analizaron. Se observó que para las bacterias totales, los valores de probabilidad en ambas dócimas fueron menores que 0.05, por lo que se incumplen dichos supuestos. Sin embargo, para el ácido isovalérico este valor fue superior a 0.05. Esto evidencia el cumplimiento de las hipótesis de bases que sustentan el análisis de varianza.

Tabla 1 Cumplimiento los supuestos teóricos del ANAVA, para las variables bacterias totales y ácido isovalérico.  

Variables Supuestos teóricos del ANAVA Dócimas estadísticas Valor P
Bacterias totales, 1011UFC/ml Homogeneidad de varianza Levene 0.0266
Normalidad de los errores Shapiro-Wilk 0.0303
Ácido isovalérico, mmol/l Homogeneidad de varianza Levene 0.3513
Normalidad de los errores Shapiro-Wilk 0.2033

Steel y Torrie (1992) y Peña (1994) señalan que la distribución normal de los errores tiene poca influencia en el ANAVA para comparar medias, ya que esta técnica es robusta ante las desviaciones de los errores. Sin embargo, plantean que la falta de normalidad puede afectar otros supuestos, como la homogeneidad de varianza, y esto sucede sobre todo, cuando el número de observaciones de los grupos son muy diferentes. No obstante, cuando se analizan componentes de varianza, la normalidad sí puede afectar el resultado del análisis.

Según Gutiérrez y de la Vara (2012), la homogeneidad de varianza es un supuesto que relaciona los residuos de los tratamientos, y ofrece una visión general de la posible igualdad entre ellos. Para su análisis se utilizan las dócimas de Levene, Bartlett, Hartley, entre otras. Sin embargo, la de Levene es más robusta ante la falta de normalidad.

Al realizar el análisis para las variables en estudio, se observó que las bacterias totales no cumplieron con la homogeneidad de varianza de los residuos. Peña et al. (2015) plantean que, de acuerdo con la naturaleza de este tipo de variable, no se recomienda el uso de los métodos estadísticos clásicos, debido a que en algunos casos el supuesto de la homogeneidad no se cumple.

Resulta necesario verificar el cumplimiento de los supuestos teóricos de los métodos estadísticos clásicos antes de iniciar el análisis estadístico para este tipo de investigación, pues de acuerdo con los resultados que se obtienen se define la selección del método estadístico apropiado. El empleo de estos modelos estadísticos también evita todos los inconvenientes que pueden incidir en los resultados esperados. Además, este tipo de modelo no requiere del cumplimiento de dichos supuestos, y estos dejan de ser un problema para el análisis de los datos.

La tabla 2 muestra el análisis de las estructuras de varianza y covarianza con el objetivo de seleccionar el modelo de mejor ajuste. Para ello se consideraron los criterios de información. Para la variable bacterias totales, el valor más pequeño se obtuvo con la de componentes de la varianza (VC), y para el ácido isovalérico la autoregresiva de orden uno (AR(1)). Sin embargo, las estructuras simetría compuesta (CS), no estructurada (UN) y la Toeplitz, no lograron la convergencia, y no se ajustaron a los datos analizados. Es por ello que no se informan los resultados para esas estructuras. Sin embargo, Gómez (2019) plantea que para la selección de la estructura de mejor ajuste a los datos se debe tener en cuenta aquella que presenta los valores más pequeños en los criterios de información.

Tabla 2 Estructura de varianza covarianza para las variables bacterias totales y ácido isovalérico. 

Variables Estructuras de covarianza Criterios de información
AIC AICC BIC
Bacterias totales, 1011 UFC/ml Toep 775.93 815.11 807.98
VC 742.77 752.77 760.58
CS - - -
AR(1) 744.77 755.90 763.47
UN - - -
Ácido isovalérico, mmol/l Toep - - -
VC 250.5 260.2 268.3
CS - - -
AR(1) 249.1 259.8 267.8
UN - - -

UFC: Unidades formadoras de colonias

Valdivieso (2013) plantea que para modelar las estructuras de covarianza se dispone de datos, en los que las varianzas-covarianzas muestrales de las variables observadas estiman los parámetros del modelo y sus errores. Liscano y Ortiz (2017) informan que si se sospecha la existencia de una estructura que se adecue a los datos, su utilización conduce a una estimación e inferencia más eficiente.

En los resultados de la tabla del análisis de varianza, se muestra que el cuadrado medio del error fue menor, cuando se usaron los procedimientos mixtos. Esto puede estar dado porque, cuando se anidan los efectos dentro del análisis, disminuye la variabilidad de los tratamientos y se logran mejores estimaciones (tabla 3). Hernández et al. (2003) refieren que, cuando se habla de estructura anidada, y los datos están agrupados en unidades experimentales de diverso orden, cada una con propiedades específicas según el nivel de agrupamiento considerado, es necesario eliminar ese efecto para que no incida en la estimación de los resultados.

Tabla 3 Resultados del cuadrado medio y probabilidad de error tipo I en la interacción para ambos análisis  

Variables Análisis estadístico Cuadrado medio del error Valor de probabilidad Tipo I
Bacterias totales, 1011 UFC/ml ANAVA 0.3712 <0.0001
GLMMIX 0.2719 <0.0001
Ácido isovalérico mmol/l ANAVA 0.4951 0.4046
MIXED 0.3824 0.2122

UFC: Unidades formadoras de colonias

Los modelos lineales generalizados mixtos y los mixtos aditivos generalizados se usan para modelar los datos anidados y estructuras de correlación espacial y temporal en datos de conteo o datos binomiales. Los de efectos mixtos aditivos y los modelos de efectos mixtos son útiles para datos anidados (llamados también datos de panel o datos jerárquicos), mediciones repetidas y datos correlacionados, temporal y espacialmente (Zuur et al. 2009).

En la tabla 4 se muestran los resultados de la interacción para el análisis de varianza clásico y del modelo lineal generalizado mixto. En ambos casos, la interacción fue significativa. Sin embargo, el error estándar resultó menor cuando se empleó este último. En el análisis se evidenció que el modelo lineal generalizado mixto, en algunos de los casos, fue más conservador para encontrar grupos similares.

Al comparar ambos modelos, algunos de los valores de las medias de los tratamientos que corresponden al modelo lineal generalizado mixto tuvieron ligero incremento. Esto se pudiera relacionar con el ajuste de la función de enlace que se selecciona de acuerdo con la distribución que sigue la variable, por lo que las medias se estiman por el efecto de dicha función de enlace.

Tabla 4 Resultados del análisis estadístico con ambos métodos, para la variable bacterias totales 

Variable Análisis estadístico Hora / Tratamiento 1 2 3 EE Signf.
Bacterias totales viables, 1011UFC/ml ANAVA Pasto estrella 2.80abcde (18.71) 2.29abcdef (11.71) 1.18f (4.71) ±0.31 P<0.0001
Superganius 1.96bcdef (8.04) 1.70cdef (5.54) 2.49abcdef (16.54)
Tunera 3.04abcd (26.21) 2.57abcdef (16.71) 2.22abcdef (10.04)
Camerún 3.64a (43.21) 3.17abc (24.71) 1.46ef (7.04)
Paraguaya 2.51abcdef (13.04) 3.41ab (31.71) 1.59ef (7.21)
Planin 2.59abcdef (17.21) 3.09abcd (23.21) 2.84abcde (19.71)
GLMMIX Pasto estrella 2.93abcde (18.71) 2.43 bcdef (11.71) 1.55 f (4.71) ±0.24 P<0.0001
Superganius 2.08 cdef (8.04) 1.71 ef (5.54) 2.81abcde (16.55)
Tunera 3.27abc (26.20) 2.82abcde (16.33) 2.31 bcdef (10.04)
Camerún 3.77 a (43.23) 3.21abc (24.71) 1.95 def (7.03)
Paraguaya 2.57 abcdef (13.04) 3.46 ab (31.72) 1.98 def (7.21)
Planin 2.85 abcde (17.21) 3.14 abcd (23.20) 2.98 abcd (19.72)

UFC: Unidades formadoras de colonia

Al analizar la variable ácido isovalérico, se observó que la interacción entre los efectos principales fue no significativa, por lo que se informaron los efectos principales (tabla 5 y 6). En el efecto de las variedades, el error estándar para el procedimiento mixto fue ligeramente menor con respecto al análisis de varianza clásico, aunque para ambos no se encontraron diferencias significativas entre los tratamientos (tabla 5).

Tabla 5 Resultados del análisis estadístico con ambos métodos para la variable ácido isovalérico, según los tratamientos.  

Análisis estadístico Tratamientos / Variable Pasto estrella Superganius Tunera Camerún Paraguaya Planin EE Signf.
ANAVA Ácido isovalérico mmol/l 2.01 1.89 1.45 1.89 1.60 1.83 ±0.17 P=0.0693
MIXED 2.01 1.89 1.45 1.89 1.60 1.83 ±0.15 P=0.0825

En la tabla 6 se informa el efecto de las horas. En ambos métodos, los errores estándar presentaron resultados similares, y no se encontraron diferencias significativas entre los horarios. Por tanto, se puede proponer este tipo de análisis para investigaciones relacionadas con experimentos de microbiología del rumen, siempre y cuando se lleve a cabo un análisis estadístico adecuado, que justifique la utilización de estos métodos.

Tabla 6 Resultados del análisis estadístico con ambos métodos para la variable ácido isovalérico, al considerar las horas. 

Análisis estadístico Horas / Variable 1 2 3 EE y Signif.
ANAVA Ácido isovalérico mmol/l 1.73 1.87 1.73 ±0.12 P=0.6046
MIXED 1.73 1.87 1.73 ±0.12 P=0.5469

Según Gómez et al. (2012) y Dicovskiy y Pedroza (2017), los modelos mixtos son una propuesta de modelación estadística avanzada, que permiten mejorar la calidad del análisis de los factores fijos y factores aleatorios, al modelar la variabilidad aleatoria y la correlación de los errores. Son modelos muy útiles en el análisis de datos desbalanceados, o de datos con algún tipo de estructura jerárquica o de agrupación.

A partir de los resultados de esta investigación, se concluye que los modelos mixtos mejoran la exactitud y precisión de los resultados del análisis. Se obtiene cuadrado medio del error más pequeño, cuando su utilizan los procedimientos mixtos, y los errores estándar disminuyen con respecto al análisis de varianza clásico. Desde esta perspectiva, se proponen estos modelos para el análisis de variables relacionadas con experimentos de conteo en la población microbiana del rumen.

References

Díaz, E.J., Bermúdez, D. & Pineda, W. 2017. Estimación de un modelo lineal generalizado mixto para datos de conteo con exceso de ceros. Diploma Thesis. Facultad de Estadística, Universidad Santo Tomás, Bogotá, Colombia [ Links ]

Dicovskiy, L.M. & Pedroza, M.E. 2017. "General and Mixed linear models in the characterization of the qualification variable, agroindustrial engineering, uni-north". Nexo Revista Científica, 30(2): 84-95, ISSN: 1995-9516 [ Links ]

Gómez, S., Torres, V., García, Y. & Navarro, J.A. 2012. "Statistical procedures most used in the analysis of measures repeated in time in the agricultural sector". Cuban Journal of Agricultural Science, 46(1): 1-7, ISSN: 2079-3480 [ Links ]

Gómez, S. 2019. Contribución estadística para el análisis de medidas repetidas en el tiempo en el sector agropecuario. PhD Thesis. Departamento de Biomatemática, Instituto de Ciencia Animal, Mayabeque. Cuba [ Links ]

Gutiérrez, H. & de la Vara, R. 2012. Análisis y diseño de experimentos. 3rd Ed. Ed. Mc Graw-Hill Latinoamericana Editores S.A de C.V, México D.F., México, ISBN: 978-607-15-0725-9 [ Links ]

Hernández, M.V., Colmenares F. & Martínez R. 2003. "Modelos jerárquicos “por piezas” en el análisis de la relación entre discontinuidad conductual y discontinuidad en procesos subyacentes". Revista Anales de Psicología, 19(1): 159-171, ISSN: 0212-9728 [ Links ]

Kramer, C.Y. 1956. “Extension of Multiple Range Tests to Group Means with Unequal Numbers of Replications”. Biometrics, 12(3): 307-310, ISSN: 0006-341X, DOI: 10.2307/3001469 [ Links ]

Levene, H. 1960. Robust tests for the equality of variance. Contributions to Probability and Statistics. 1st Ed. Ed. Stanford University Press, Palo Alto, California, USA, p. 278-292. [ Links ]

Liscano, J.M. & Ortiz, A. F. 2017. Modelos mixtos para datos composicionales: Una aplicación con resultados electorales en Colombia. Diploma Thesis. Facultad de Estadística, Universidad Santo Tomás, Bogotá, Colombia [ Links ]

Mandujano, S., Kéry, M. & Royle, J. A. 2016. "Applied hierarchical modeling in ecology: analysis of distribution, abundance and species richness in R and BUGS". Revista Mexicana de Biodiversidad, 88(2): 485-486, ISSN: 2007-8706, DOI: http://dx.doi.org/10.1016/j.rmb.2017.03.028Links ]

Monterubbianesi, M.G. 2017. Evaluación de alternativas para el análisis estadístico y de aspectos del diseño en ensayos de larga duración para estudios agronómicos. PhD Thesis. Departament de Producció Vegetal i Ciència Forestal , Universitat de Lleida, Catalunya, España, p. 193 [ Links ]

Nelder, J.A. & Wedderburn, R.W.M. 1972. "Generalized linear models". Journal of the Royal Statistical Society: Series A (General), 135(3): 370-384, ISSN: 1467-985X, DOI: https://doi.org/10.2307/2344614Links ]

Peña, S. 1994. Estadística. Modelos y métodos: 2. Modelos lineales y series temporales. 4th Ed. Ed. Alianza, S.A., Madrid, España, p. 745, ISBN: 84-206-8110-5 [ Links ]

Peña, J.A., Rosales, Y. & Giampaolo, O. 2015. "Estudio del crecimiento bacteriano. Enfoque de análisis de datos con medidas repetidas". Revista de la Facultad de Farmacia, 57(2): 8-17, ISSN: 2244-8845 [ Links ]

SAS Institute Inc. 2013. Statistical Analysis Software SAS/STAT®, version 9.1.3, Cary, N.C., USA, Available: <http://www.sas.com/en us/software/analytics/stat.html#>. [ Links ]

Shapiro, S. & Wilk, B. 1965. "An analysis of variance test for normality (complete samples)". Biometrika, 52(2): 591-611, ISSN: 1464-3510, DOI: http://dx.doi.org/10.2307/2333709Links ]

Steel, R.G. & Torrie, I.H. 1996. Bioestadística: principios y procedimientos. 2nd Ed. Ed. McGraw-Hill Interamericana SA., México D.F., México, p. 622, ISBN: 968-451-495-6 [ Links ]

Valdivieso C.E. 2013. "Efecto de los métodos de estimación en las modelaciones de estructuras de covarianzas sobre un modelo estructural de evaluación del servicio de clases". Revista Comunicaciones en Estadística, 6(1): 21-43, ISSN: 2027-3355, DOI: https://doi.org/10.15332/s2027-3355.2018.0001.03Links ]

Wang, T., He, P., Ahn, K.W., Wang, X., Ghosh, S. & Laud, P. 2015. "A re-formulation of generalized linear mixed models to fit family data in genetic association studies". Frontiers in Genetics, 6: 120, ISSN: 1664-8021, DOI: https://doi.org/10.3389/fgene.2015.00120Links ]

Zuur, A., Ieno, E., Walker, N., Saveliev, A. & Smith, G. 2009. Mixed Efects Models and Extensions in Ecology with R. Ed. Springer Science & Business Media, New York, USA, ISBN: 978-0-387-87457-9, DOI: https://doi.org/10.1007/978-0-387-87458-6Links ]

Recibido: 12 de Junio de 2019; Aprobado: 06 de Enero de 2020

Creative Commons License This is an open-access article distributed under the terms of the Creative Commons Attribution License