INTRODUCCIÓN
En las últimas décadas se ha dado una atención especial a los estilos de vida (EdV) definidos como aquellas condiciones que, aunadas a otras más del ambiente, pueden favorecer la salud o crear condiciones de riesgo para la misma. La adquisición a temprana edad de estilos de vida saludable es prioritaria para la prevención de condiciones relacionas con la obesidad,1 ya que se ha observado que mejorar los EdV es una estrategia efectiva para prevenir y retrasar la aparición de enfermedades crónicas.2 Sin embargo, además de la alimentación y la actividad física, los EdV están relacionados con el ocio, las horas de sueño, los hábitos de estudio, el comportamiento sexual, el consumo de drogas, el cuidado de la salud, el apoyo social, el manejo del estrés y la apreciación por la vida.3
Por lo anterior, atender aspectos relacionados con los EdV en jóvenes es complejo pero especialmente relevante por las características propias de esta etapa vital donde enfrentan la inestabilidad inherente a la transición de la adolescencia a la adultez, cambios importantes en sus redes sociales y ambientes y con todo ello la posibilidad de adquirir y consolidar conductas de riesgos para la salud.4
Aunque las enfermedades crónicas relacionadas con estilos de vida afectan a todos los grupos poblacionales, en las últimas décadas las mujeres han mostrado incremento en la prevalencia de patologías como las cardiovasculares,5 el cáncer,6 la diabetes,5 la obesidad,7 las dislipidemias,8 entre otras. Dichas patologías están relacionadas con inadecuados EdV adquiridos y consolidados a temprana edad. En estudiantes universitarias se ha identificado alta frecuencia de sedentarismo,8 consumo de tabaco, alcohol y marihuana,9 mala calidad del sueño10 e inadecuada alimentación.11
Aunque hay esfuerzos incipientes por parte de las universidades para revertir y prevenir estas condiciones, los EdV saludables en las mujeres parecen no ser lo más frecuente.12 Lo anterior se suma a la carencia de instrumentos validados para la medición del EdV adaptados a distintos contextos culturales,13,14 creando un panorama poco alentador para la salud de las mujeres, dado que dificultaría la detección de aquellos casos que ameriten una orientación inmediata.
A fin de brindar una alternativa de evaluación, Dong y otros desarrollaron una escala en estudiantes universitarios chinos denominada Healthy Lifestyle Scale for University Students (HLSUS),15 que posteriormente fue adaptada en universitarios iraníes.16 La HLSUS está basada en el modelo de promoción de la salud de Pender.15 Dicho modelo incorpora algunos aspectos que intervienen en la modificación de la conducta de los seres humanos poniendo énfasis en las actitudes y las motivaciones hacia el accionar que promoverá la salud.17 Integra las características y experiencias individuales, las cogniciones y afectos relativos a la conducta específica y el resultado conductual, como un proceso que lleva al individuo a participar o no en comportamientos de salud.17 Derivado de este modelo la HLSUS permite por una parte identificar comportamientos que promueven la salud así como comportamientos de riesgo para la misma.15
Brevemente, en el estudio de validación original de la HLSUS usaron un análisis de componentes principales con rotación varimax15 obtuvieron una versión final de 38 ítems distribuidos en ocho dimensiones que explican 52,02 % de la varianza: Social support (6 ítems, α = 0,79), Life appreciation (5 ítems, α = 0,83), Regular behavior (4 ítems, α = 0,70), Nutrition behavior (4 ítems , α = 0,71), Exercise behavior (4 ítems, α = 0,62), Health risk behavior (4 ítems, α = 0,61), Stress management (5 ítems, α = 0,74) and Health responsibility (6 ítems, α = 0,72). La confiabilidad de la puntuación total fue α = 0,89.15 Posteriormente, fue traducida al persa y trabajada en estudiantes universitarios iraníes.16 Con relación al análisis de su estructura interna, realizaron análisis factorial exploratorio con rotación varimax, que arrojó una solución de ocho factores que explicaron 53,3 % de la varianza total: social support (6 ítems, α = 0,74), life appreciation (4 ítems, α = 0,76), regular behavior (8 ítems, α = 0.77), exercise and nutritional behavior (6 ítems, α = 0,70), health risk behavior (2 ítems, α = 0,76), stress management (4 ítems, α = 0,66), health responsibility (6 ítems, α = 0,68) and inaccurate habits (2 ítems, α = 0,63). La confiabilidad general de la escala fue de α = 0,87.16
Aunque la escala de Dong y otros y su adaptación iraní mostraron una estructura interna relativamente robusta y adecuada confiabilidad en cada cultura, esa evidencia corresponde a poblaciones culturalmente muy diferentes a la mexicana y en idiomas distintos al español. Por ello, y dada su potencial utilidad como medida de tamizaje en la evaluación de los EdV, y dado que el grupo de mujeres universitarias ha sido identificado como vulnerable y que requiere un abordaje a nivel preventivo dadas las altas prevalencias de conductas dañinas para su salud, y en consecuencia mayores problemas como la obesidad.11
Para contar con una herramienta que permita la valoración de los EdV se realizó esta investigación, con el objetivo de analizar las propiedades psicométricas en jóvenes estudiantes universitarias mexicanas a partir de la traducción de la HLSUS.
MÉTODOS
Se trata de un estudio instrumental, orientado al análisis de las propiedades psicométricas de un instrumento de evaluación. En este caso, la dimensionalidad y confiabilidad de puntuaciones y constructo del Healthy Lifestyle Scale for University Students.
El estudio se llevó a cabo entre enero y diciembre de 2016. El universo se integró por 10 200 mujeres que cursaban estudios de licenciatura en dos universidades públicas mexicanas, en la región Xalapa y el Campus Juchitán. De forma no probabilística fue recolectada información de 530 mujeres con edades que oscilaban entre 18 y 25 años (Medad = 20,3; DEedad = 1,6). Hubo participación proporcional de cada uno de los años escolares: primer año 28,9 %; segundo año 25,5 %; tercer año 27,7 %; cuarto año y superiores 17,9 %. Hubo participación de estudiantes de las seis áreas académicas en que se organizan los pregrados: artes, ciencias biológico-agropecuarias, ciencias de la salud, económico-administrativas, humanidades y técnica.
Healthy Lifestyle Scale for University Students (HLSUS) propuesta por Dong, Xiao-hui y Xian-bo,15 evalúa ocho dimensiones vinculadas con el EdV (Social support, Life appreciation, Regular behavior, Nutrition behavior, Exercise behavior, Health risk behavior, Stress management, y Health responsibility) por medio de 38 ítems en formato de respuesta ordinal de cinco opciones.
El instrumento fue traducido del inglés al español por un profesor estadounidense con dominio de ambos idiomas. En la siguiente fase fue revisado por tres mexicanos expertos en el tema de estilos de vida y con dominio del idioma inglés, quienes adaptaron el ítem 10 que señalaba “Beber por lo menos 800 mililitros de agua al día”, por “Beber por lo menos 2 litros de agua al día”, considerando los estándares nacionales e internacionales de consumo de agua. Posteriormente la escala fue piloteada con 20 estudiantes universitarios mexicanos (que no formaron parte de la muestra definitiva) para identificar la comprensión de la misma. Finalmente la versión adaptada fue sometida a una retrotraducción al inglés realizada por otro profesor estadounidense que domina tanto idioma inglés como el español para garantizar su correcta adaptación. La mayoría de los ítems fueron de fácil traducción, solo fue necesario hacer traducción por equivalencia conceptual en lugar de hacerlo literalmente para facilitar la comprensión de algunas palabras o frases. Por ejemplo en el ítem 6, “regular intervals” fue sustituido por “horario regular”; así mismo en el ítem 9, “replenishing fluids” fue sustituido por “consumo de líquidos”.
La muestra fue tomada de dos universidades públicas de México, se invitó a las estudiantes mujeres a participar en la misma y a quienes aceptaron se les proporcionó el consentimiento informado y el cuestionario para que realizaran el llenado del mismo de forma individual.
De forma previa a los análisis, fueron examinadas las características descriptivas de los ítems (medidas de tendencia central, de dispersión, y de distribución).
En vista que el instrumento posee dos estructuras previas claramente identificadas,15,16 fue realizado en primera instancia un análisis factorial confirmatorio (AFC) con el método de máxima verosimilitud robusto18 y matriz de correlaciones policóricas. En dicho procedimiento se utilizaron diferentes índices de ajuste para evaluar los modelos: RMSEA (≤ 0,05), CFI (≥ 0,95), SRMR (≤ 0,05) y la prueba general χ² corregida por la falta de normalidad de las variables (SB-χ2).19
Posteriormente, dado que las estructuras factoriales propuestas tuvieron un ajuste insuficiente, se implementó un análisis factorial exploratorio (AFE) ejecutado con el programa FACTOR v.10.4.01.20 Inicialmente, fue evaluada la pertinencia de usar el AFE mediante la inspección del test de esfericidad de Bartlett, el KMO y la significancia estadística de la matriz de correlaciones. Luego, mediante el análisis paralelo (AP)21 fue determinado el número óptimo de factores que deben ser extraídos.
Para la ejecución del AFE, el método de extracción factorial elegido fue de mínimos cuadrados no ponderados robustos (MCNPR), que tuvo como base la matriz de correlaciones policóricas, ya que por la dispersión de los ítems estos podrían considerarse medidas ordinales e incluso algunos casos la asimetría y curtosis fueron elevadas.22 Fue usada la rotación oblicua Promin,23 dado que los factores están teóricamente relacionados. Los intervalos de confianza (IC) para las cargas factoriales se estimaron con un método boostrap no paramétrico denominado bias-corrected acceleration (BCa) y aplicado por Lambert, Wildt, y Durand24 en el contexto del AFE. En primera instancia fueron retenidos los ítems con carga factorial mayor que 0,32 (λ > 0,32).25
Con la solución final, fue calculado el índice de simplicidad factorial por ítem (ISF) con el programa SIMLOAD.26 El ISF indica el grado en que el ítem está influido de forma significativa por más de un constructo, lo que dificultaría su interpretación ya que su pertenencia a uno u otro no estaría definida. Luego de dicho procedimiento, solo fueron conservados los ítems con una magnitud moderada del ISF (≥ 0,75) y cuyo límite inferior del IC para la carga factorial fuera mayor que 0,32. Además de ello, fueron valorados los índices de ajuste asociados a la solución factorial resultante (χ2, CFI y RMSEA) en el marco del AFE, cuya interpretación es similar a la mostrada en el AFC.
Si bien suele considerarse la estimación puntual de la carga factorial (λ) como un criterio para retener el ítem, es conveniente utilizar como referencia el IC debido a que diversas fuentes de error pueden afectar cualquier estimación puntual, y por ello los IC proveen información esclarecedora.27 Entonces, si el límite inferior del IC de la carga factorial es mayor que 0,32, sería evidencia de que, aun en el caso más desfavorable, la carga factorial será lo suficientemente elevada. Esta decisión garantizaría factores más robustos e interpretables. Además, cabe precisar que el criterio adoptado para la valoración del ISF es flexible (0,75), en vista que la literatura especializada recomienda límites más elevados para valorar la simplicidad de los ítems (ISF > 0,80).26 En tal sentido, los ítems que no cumplieron estas condiciones fueron eliminados, ya que un ISF elevado indica que el ítem es influido significativamente por dos o más factores simultáneamente.
Finalmente, fue evaluado un modelo jerárquico directo mediante la solución de Schmid y Leiman,28 a fin de determinar si es pertinente la consideración de un factor general (FG) que sustenta el uso de una puntuación total (esto es, la sumatoria de todas las dimensiones). Se consideró que el FG es lo suficientemente fuerte si es capaz de explicar al menos 40 % de la varianza verdadera.29 El procedimiento fue llevado a cabo con el programa FACTOR v.10.4.01.20
La confiabilidad de las puntuaciones fue evaluada utilizando el coeficiente α complementados por su IC al 95 % calculado con el módulo ICalfa.27 Para estimar la confiabilidad del constructo se empleó el coeficiente ω, apropiado para medidas congenéricas y menos dependiente de la cantidad de ítems.
Posteriormente, previo cálculo del coeficiente α ordinal (αordinal) con un módulo específico,30 fue estimado el porcentaje de atenuación que permite cuantificar el grado de la infraestimación del coeficiente α ante el incumplimiento del supuesto de tau-equivalencia al compararlo con el αordinal.
El protocolo de investigación fue revisado y aprobado por un comité de investigaciones de una de las universidades donde se llevó a cabo el proyecto asignando el número de registro DGI405002015124. Las participantes fueron orientadas sobre los fines del estudio y firmaron un consentimiento informado. En todo momento se cuidó la confidencialidad de los datos. Se cumplieron las normas éticas del Comité de Investigación y de la Declaración de Helsinki de 1975 con la revisión de octubre del 2000.
RESULTADOS
Como puede apreciarse en la tabla 1, la mayoría de los ítems presentan estadísticos de distribución (asimetría y curtosis) dentro de límites aceptables, excepto algunos (p. e. ítem 13) que poseen magnitudes elevadas.
Análisis factorial confirmatorio. Los datos mostraron un ajuste inadecuado al modelo chino (SB-χ² [637] = 1448,537 [p < 0,001]; CFI = 0,931; RMSEA [IC 90 %] = 0,050 [0,046 - 0,053]; SRMR = 0,077), evidenciando un caso Heywood (h 2 > 1,000) en el ítem 13. Luego de eliminar el ítem, el ajuste no mejoró sustancialmente (SB-χ² [601] = 1434,875 [p < 0,001]; CFI = 0,928; RMSEA [IC 90 %] = 0,052 [0,048 - 0,055]; SRMR = 0,076). Del mismo modo, tampoco se obtuvo un ajuste adecuado al modelo iraní (SB-χ² [637] = 1611,554 [p < 0,001]; CFI = 0,917; RMSEA [IC 90 %] = 0,054 [0,051 - 0,058]; SRMR = 0,088). Además, en ambos casos los IM mostraron más de 100 potenciales reespecificaciones de cargas cruzadas estadísticamente significativas. Es decir, que el modelo mejoraría si más de un ítem es influido significativamente por un factor distinto al que pertenece (potencial complejidad factorial).
Análisis factorial exploratorio. Las condiciones fueron propicias para realizar el análisis factorial: matriz de correlaciones y test de esfericidad de Bartlett estadísticamente significativos (p < 0,001), y KMO de magnitud adecuada (0,838). El AP realizado sugirió la extracción de seis factores.
Luego de ejecutar el primer análisis factorial, los seis factores explicaron de forma conjunta el 50,504 % de la variabilidad de las puntuaciones. No obstante, dos de los ítems (15 y 16) presentaron cargas factoriales bajas (λ < 0,30), y muchos de ellos (20 ítems) presentaron elevada complejidad factorial (ISF < 0,75) por lo que fueron eliminados.
Con los 16 ítems restantes fue realizado nuevamente un AP, el cual sugirió extraer cuatro factores. Si bien la magnitud del KMO disminuyó respecto al primer análisis (0,754), el porcentaje de varianza aumentó respecto al anterior (58,297 %). No obstante, pese a las mejoras observadas, dos ítems (1 y 4) fueron eliminados porque el límite inferior del IC de cada carga factorial fue bastante menor que 0,32.
Fue realizado un tercer, y definitivo, análisis factorial con los 14 ítems restantes. Los resultados indican que los cuatro factores explican el 64,444 % de la varianza de los ítems, mostrando además un ajuste adecuado (χ2 = 33,307 [p = 0,798]; CFI = 0,971 [IC95 % 0,965 - 0,983]; RMSEA = 0,045 [IC95 % 0,036 - 0,048]). Complementariamente, el límite inferior del IC de cada carga factorial fue cercano a 0,32, ISF elevados, y correlaciones entre factores fueron de magnitud moderada (Tabla 2).
Luego de ejecutar la solución de Schmid-Leiman, los resultados indican que la cantidad de varianza explicada por el FG no es suficiente para considerar que su influencia sobre los ítems es más significativa que la influencia de los factores específicos (Tabla 3). Además, las cargas factoriales de la mayoría de los ítems en sus respectivos factores específicos siguen siendo adecuadas (λ > 0,32). Por tal motivo, los ítems son mejores mediciones de los factores específicos que del FG, y por ello no se justificaría el uso de una puntuación total.
Confiabilidad. Los coeficientes mostrados son de magnitud adecuada considerando el tamaño muestral y número de ítems por factor, aunque la dimensión Relaciones interpersonales presenta coeficientes de magnitudes por debajo de lo esperado (< 0,70; Tabla 3). Finalmente, el coeficiente α se atenúa en mayor grado en F1 (Consumo de sustancias) que en los demás factores.
DISCUSIÓN
Los EdV son aceptados como uno de los factores clave en los que debe incidirse para mejorar las condiciones de salud de las poblaciones. Sin embargo, su medición es compleja y es común encontrar en la literatura científica trabajos que presentan debilidades en el plano psicométrico que restan confiabilidad a los resultados obtenidos, dificultando así la toma de decisiones. Si bien los EdV suele consolidarse en la juventud, son aún más escasos los instrumentos disponibles para este grupo poblacional. Por ello, la HLSUS desarrollada por Dong y otros15 representa un aporte significativo por la multidimensionalidad de la misma que brinda una visión amplia de los EdV, por ello el objetivo de este trabajo fue valorar sus propiedades psicométricas en estudiantes universitarias mexicanas ante la carencia de escalas para esta población.
El análisis de la estructura interna se orienta a determinar qué ítems son representativos del constructo evaluado, por lo que es probable que dicha configuración varíe de una cultura a otra. En este caso, la configuración del HLSUS obtenida en Irán y China no fue replicada con éxito en México, quizás por un aspecto cultural, así como por la configuración de la muestra, ya que en dichos estudios participaron varones y mujeres, mientras que en el presente trabajo solo fueron evaluadas mujeres. Además, algunos estadísticos asociados a los ítems (carga factorial, ISF, etc.) no permitieron conservar un gran número, derivando en una nueva versión con dimensiones teóricamente coherentes. Cabe mencionar que al analizar el límite superior de los IC de las cargas factoriales, cuatro de los ítems fueron casos Heywood,31 y si bien las cargas factoriales puntuales pueden considerarse como apropiadas, las comunalidades de estos eventualmente podrían exceder la unidad. En tal sentido, podrían ser eliminados debido a que formarían parte de una solución impropia, pero fueron mantenidos porque aquello puede ser un efecto del error de muestreo.
Entonces, en esta adaptación de la HLSUS al español se obtuvo una escala breve de 14 ítems que valoran cuatro dimensiones: consumo de sustancias, apreciación por la vida, relaciones interpersonales y patrones de alimentación, estudio y descanso. Estas dimensiones permiten evaluar los aspectos de los EdV que han sido mayormente vinculados a la aparición de enfermedades crónicas no transmisibles como es el caso de la alimentación,11 el sueño y descanso,10 el consumo de alcohol, tabaco y marihuana,9 así como aquellos aspectos que previenen enfermedades y favorecen la promoción de la salud,3 por lo que las implicancias prácticas de la escala son claras, ya que podría ser usada como parte de las evaluaciones masivas a estudiantes que cursan la carrera o de nuevo ingreso, a fin de detectar qué personas podrían tener EdV que traigan consecuencias nocivas para su salud.
Por otro lado, una práctica común cuando se evalúan instrumentos multidimensionales es el uso de una puntuación general asociada a un FG, aunque en pocas ocasiones se explora. El análisis del FG es relevante, debido a que normalmente muchos investigadores asumen a priori que todos los ítems de un instrumento son influidos por un FG, pero no evalúan empíricamente dicha hipótesis, lo que podría conducir a un mal uso de los instrumentos de evaluación, llevando a concluir sin fundamento. En tal sentido, y pese a la brevedad de la versión obtenida, no se justificaría el uso de una puntuación total, y es probable que esta conclusión se extienda a las versiones previas,15,16 aunque eso tendría que ser corroborado en esas poblaciones.
Finalmente, en términos generales, las estimaciones de la confiabilidad de las puntuaciones y del constructo estuvieron dentro de los límites aceptables, salvo la dimensión relaciones interpersonales (< 0,70). Además, dado que el porcentaje de atenuación no fue sustancialmente elevado (< 20 %), indicaría que la violación del supuesto de tau-equivalencia no significó un impacto serio en las estimaciones.
En conclusión, la adaptación al español de la HLSUS es una herramienta con adecuadas propiedades psicométricas para la medición de EdV en mujeres estudiantes universitarias. Pese a ello, es necesario estudios de replicación para consolidar estos resultados, y aquellos que permitan asociar al HLSUS con constructos relacionados teóricamente, así como con indicadores clínicos (p.e., colesterol, glucosa, cortisol, entre otros).