Introducción
Una planificación deficiente del turismo implica una mala gestión que, sin dudas, degrada esta actividad. Los destinos de todo el mundo se ven beneficiados cuando se gestiona correctamente este sector, a partir de una planificación adecuada (Hącia, 2019). El efecto integrador que abarca a casi todos los sectores de la economía convierten al turismo en una de las industrias más diversas del mundo (Meschede, 2020).
Son innumerables sus efectos de orden social y también puede ser visto como una actividad económica por elementos definitorios. Es por ello que el sector turístico debe ser capaz de comprender la demanda y cómo se distribuirá a lo largo del tiempo (Feng et al., 2019).
En tal sentido, la demanda de un destino se convierte en objeto de estudio de suma importancia: conocer las características de los viajeros, a qué segmento pertenecen, el gasto turístico, los niveles de satisfacción, entre otros. El análisis de los rasgos distintivos de la demanda turística conlleva a diseñar las acciones para que el destino sea capaz de satisfacer las necesidades y deseos del turista (Chenguang Wu et al., 2017).
Centrarse en el pronóstico a largo plazo (mensual, trimestral y anual) de áreas relativamente grandes (provincias, países y regiones) permite la estimación y el análisis de la demanda futura para un producto en particular, un componente o un servicio a través de diferentes técnicas de previsión. El pronóstico de la demanda futura es central en cualquier actividad de planificación y de operaciones, en particular, en actividades relacionadas con la logística y con la cadena de suministro.
Es evidente la pertinencia de pronosticar para planear el sistema productivo, el abastecimiento y los despachos, de manera que la cadena de suministros opere correctamente. Estas herramientas permiten la obtención de información relevante, precisa y confiable; entonces, es necesario que las empresas utilicen correctamente los modelos y procedimientos más adecuados para tal fin (C. Li et al., 2020).
A nivel organizacional, el pronóstico de la demanda es un insumo esencial para cualquier decisión en las distintas áreas funcionales: ventas, producción, compras, finanzas y contabilidad. Los pronósticos también son necesarios en los planes de distribución y aprovisionamientos. La importancia de un pronóstico con escaso margen de error es fundamental para la eficiencia y la eficacia. Esto ha sido en gran parte reconocido por diversos autores (Shaowen Li et al., 2018).
Enmarcado en este contexto, se encuentran los antecedentes de las primeras investigaciones respecto a los pronósticos de la demanda turística en Cuba, las cuales no son numerosas, pero las existentes contienen un alto grado de novedad práctica y científica. Tal es el caso de pronósticos efectuados por el Centro de Estudios Turísticos de la Universidad de la Habana y por el Instituto Nacional de Investigaciones Económicas del Ministerio de Economía y Planificación de Cuba.
Entre los autores más relevantes que abordan elementos sobre los estudios de la demanda turística en Cuba, se destacan: Figuerola et al. (2005), Rigol Madrazo et al. (2009), Josefá Barbosa y Parada Gutiérrez (2010), Rodríguez Betancourt y Estévez Mártir (2012), La Serna Gómez (2012), Delgado Castro y Martín Fernández (2014), González Laucirica y Santa Cruz Rodríguez (2014) y Díaz Pompa et al. (2020).
De manera general, estos investigadores proponen modelos que contemplan, como ventajas, rasgos del pronóstico de la demanda turística a corto y mediano plazo; incluyen factores que pueden modificar el pronóstico de la demanda en el sector turístico, además de segmentar el mercado emisor; pero no abarcan, de manera explícita, los diversos factores que han influido a través del tiempo. Son escasos los modelos matemáticos de fácil manejo, sustentado en herramientas informáticas; los pronósticos de la demanda turística carecen de proyecciones con distintos márgenes de error para un análisis de mayor profundidad o, simplemente, mencionan el pronóstico de la demanda turística como herramienta fundamental para la toma de decisiones sin hacer uso práctico de la misma.
Por lo tanto, la presente investigación plantea como objetivo: elaborar un modelo de pronóstico a largo plazo para la demanda turística, mediante la aplicación de la metodología Box-Jenkins, que permita caracterizar la evolución turística en este sector estratégico para la economía cubana y proyectar pronósticos con distintos niveles de confiabilidad.
Materiales y métodos
Para caracterizar la situación actual de la demanda turística en Pinar del Rio, Cuba, se emplea el análisis documental y la observación científica. Se emplean métodos estadísticos-matemáticos y herramientas como la metodología Box-Jenkins (Box et al., 1970). Se emplearon los softwares R 3.6.3 y R Studio 1.2.5033 para el procesamiento de los datos y la información disponible. También fueron utilizados métodos teóricos para reseñar el desarrollo de los actuales procesos de gestión del turismo en Pinar del Río. Para el análisis, se utilizó la serie cantidad de turistas mensuales entre enero del año 2006 y diciembre de 2018.
El pronóstico comienza con la identificación del Proceso Autorregresivo de Integración de Medias Móviles, utilizando las funciones de auto-arima del software R. Con los parámetros estimados, se conforma el modelo que se valida mediante el análisis de los residuos. Los residuos deben de estar incorrelacionados para que el modelo sea adecuado. Esto es lo que se conoce como metodología Box-Jenkins (Petrevska, 2017).
Modelo Autorregresivo Integrado de Media Móvil
ARIMA es reconocido como uno de los modelos estadísticos de predicción más importantes en las investigaciones sobre los modelos de series de tiempo y creado por Box y Jenkins en 1970. Marcó el comienzo de una nueva generación de herramientas de pronóstico, popularmente conocida como metodología de Box-Jenkins, pero técnicamente conocida como metodología ARIMA.
Está compuesto por dos modelos, el Autorregresivo (AR) y el de Medias Móviles (MA). Tiene parámetros específicos para las series de tiempo: los parámetros p y q, los cuales representan el orden del AR y el orden de la MA, respectivamente. Se adiciona un parámetro d que representa el número de las diferencias (Shuyu Li et al., 2018).
El modelo AR se escribe como: y t = c + a 1 y t-1 + … + a p y t-p +u t , donde a 1 ,a 2 ,a 3 ,…,a p son los parámetros del AR, c es una constante, p es el orden del AR, y u t es el ruido blanco. Continuamente el modelo MA se puede escribir como: y t = μ + u t + m 1 u t-1 + … + m q u t-q , donde m 1 ,m 2 ,m 3 ,…,m q son los parámetros de MA, u t ,u t-1 ,…,u t-q son los términos del ruido blanco y μ es lo que se espera de y t . Integrando estos modelos para obtener el modelo ARIMA, se tiene la expresión siguiente: y t = c + a 1 y t-1 + … + a p y t-p + u t + μ + u t + m 1 u t-1 + … + m q u t-q , donde p y q son los términos del proceso autorregresivo y de medias móviles respectivamente.
Modelo Autorregresivo Integrado de Media Móvil Estacional
El Proceso Autorregresivo Integrado de Media Móvil Estacional (SARIMA) es una extensión del ARIMA en el caso de que la serie estacionaria presente el componente estacional, el cual incluye nuevos términos para la diferenciación de orden 12 (Bakar & Rosbi, 2017).
Los modelos ARIMA estacionales (P, D, Q) complementan el modelo general no estacional ARIMA (p, d, q), desarrollados para captar los patrones estacionales trimestrales o semestrales presentes en las series temporales (Box et al., 1970). La combinación de modelos ARIMA (p, d, q), no estacionales, con ARIMA (P, D, Q) estacionales, conduce al modelo SARIMA (p, d, q)×(P, D, Q), también conocido como ARIMA multiplicativo (López et al., 2017). En forma agregada, su representación general es: donde: d es el número de diferencias regulares, D es el número de diferencias estacionales, s es la amplitud estacional, α constante óptima, q es el número de componentes de medias móviles, Q es el número de componentes de medias móviles estacionales, θ q son los coeficientes de medias móviles, Θ Q son los coeficientes de medias móviles estacionales, p es el número de componentes autorregresivos, P es el número de componentes autorregresivos estacionales, Ø p son coeficientes de los procesos autorregresivos, Φ p son los coeficientes de los procesos autorregresivos estacionales.
Función de autocorrelación
La función de autocorrelación (ACF) es una herramienta de gran utilidad en la identificación del orden de un modelo de MA. La ACF de un MA(q) se anula después del retardo q, es decir, ρ k ≈ 0 para k > q, entonces se tiene que el proceso puede ser modelado mediante un procedimiento de medias móviles de orden q, MA(q). La ACF representa gráficamente los valores de correlación para k retardos de tiempo (Petrevska, 2017).
Dado el supuesto de estacionariedad, donde se tiene var(y t ) = var(y t-1 ) la función de autocorrelación se denomina función de autocorrelación parcial (PACF), representa en el gráfico los valores para un desfase k y se implementa para seleccionar el orden del proceso AR. Esta PACF se construye a partir de la expresión siguiente: .
Ambas se utilizan para el análisis de los residuos y para comprobar si el modelo es adecuado o no.
Resultados y discusión
Para cumplimentar el objetivo, se aplicó un análisis univariante de series temporales, con el fin de observar el comportamiento de la serie demanda turística en la Cadena Hotelera Cubanacán, en el periodo comprendido entre enero del año 2006 y diciembre del año 2018. Conviene tener presente que una serie temporal se compone de tendencia, fluctuación cíclica, variación estacional y movimientos irregulares.
Al realizar la representación gráfica de la serie, se puede clasificar como estacionaria, pues la misma oscila alrededor del valor medio histórico de 4364 turistas como se puede apreciar en la figura 1. La prueba Dickey-Fuller, aumentada mediante R, confirma esta clasificación, con un valor de probabilidad de 0.02647, no superando al nivel de significación de 0.05. Cabe recordar que esta tiene como hipótesis alterna que la serie temporal es estacionaria.
Al descomponer la serie temporal para el análisis de la tendencia y la estacionalidad, se presenta un gráfico que contiene cada componente de la serie, obtenido mediante el método de las medias móviles. En la figura 2, se muestran los valores observados, el componente estacional, la tendencia y los residuos.
Se observan, además, tres fluctuaciones importantes: la primera comienza en el año 2008 a causa de la crisis económica mundial y el azote de los huracanes Gustav e Ike; la segunda se evidencia a partir del año 2013, al entrar en pánico el mundo por el brote pandémico de la enfermedad del Ébola y la tercera, posterior al año 2015, debido a la apertura de las relaciones Cuba-Estados Unidos; no obstante, muestran un decrecimiento a partir del año 2017 como consecuencia del retroceso de estas relaciones.
En los gráficos de cajas, se puede apreciar que los años de mayores picos fueron 2006, 2007, 2013 y 2016. En el año 2013, ocurrió la mayor cantidad de visitantes turistas con una baja variabilidad y se corrobora la disminución a partir del año 2017 (Fig. 3a).
Si se describe la serie por meses, se pueden observar las temporadas que predominan en la cadena hotelera: temporada alta y temporada baja. La temporada alta se concibe a partir de la llegada de los meses de bajas temperaturas en el hemisferio norte (de noviembre a abril) y la temporada baja, los meses más cálidos (de mayo a octubre). Se extrae del gráfico de la figura 3b que los meses de más estabilidad turística son enero y mayo. No ocurre así para los meses, desde agosto hasta noviembre.
La tabla 1 muestra la demanda turística media por años y por meses. Nos permite determinar los años y los meses de mayor y de menor demanda.
Mes | Media | Año | Media | Año | Media | |
---|---|---|---|---|---|---|
Ene | 5171 | 2006 | 4699 | 2018 | 3456 | |
Feb | 4779 | 2007 | 4644 | |||
Mar | 5506 | 2008 | 4121 | |||
Abr | 4950 | 2009 | 4419 | |||
May | 3778 | 2010 | 4448 | |||
Jun | 2902 | 2011 | 4287 | |||
Jul | 5061 | 2012 | 4287 | |||
Ago | 2870 | 2013 | 5023 | |||
Sep | 2936 | 2014 | 3798 | |||
Oct | 3616 | 2015 | 4013 | |||
Nov | 5177 | 2016 | 4566 | |||
Dic | 4383 | 2017 | 4292 |
Fuente: Elaboración propia
El correlograma de la serie demanda turística en la Cadena Hotelera Cubanacán, que se muestra en la figura 4, permite comprobar que existe un predominio del componente estacional, evidenciado por la presencia de un máximo relativo para el retardo 12; además de estar presente el componente tendencia, pero en menor grado, al ir los valores de la función de autocorrelación de positivos a negativos.
Al detectar estos elementos, a partir de las características de la serie, la opción más recomendable es utilizar los modelos SARIMA. Será necesario realizar una diferenciación de orden doce para eliminar la estacionalidad y, de este modo, lograr una serie puramente estacionaria previa a la aplicación del modelo.
Para la selección del modelo más adecuado, se empleó la función auto-arima de R. A partir de criterios conocidos de predictibilidad, esto es, el criterio de Información de Akaike (AIC), el criterio de Información de Akaike Corregido (AICc) y el criterio de Información Bayesiano (BIC). Además, se emplean las medidas de exactitud como el Error Porcentual Medio (MPE), el Error Porcentual Absoluto Medio (MAPE) y el Error Escaldo Absoluto Medio (MASE). La tabla 2 muestra los resultados que se obtienen a través del software.
Serie demanda turística ARIMA (0.0.0) (1.0.0) [12] | ||
---|---|---|
Coeficientes | Sar1 | Media |
0.5412 | 4217.399 | |
s. e | 0.0683 | 226.816 |
AIC=2697.39 | AICc=2697.55 | BIC=2706.52 |
MPE=-138.9312 | MAPE=157.0537 | MASE=1.064214 |
Fuente: Elaboración propia
El modelo más adecuado que minimiza todas las medidas de dispersión es un modelo con una diferenciación de orden doce y de orden uno en la parte autorregresiva de la estacionalidad, o sea, un modelo SARIMA (0, 0, 0) (1, 0, 0), con ecuación del modelo .
Para validar el modelo, se realiza el contraste de Ljung-Box-Pierce, también conocido como test de portmanteau. La hipótesis nula es que las primeras autocorrelaciones son nulas. El resultado, con un valor de probabilidad igual a 0.1894, implica que las correlaciones son estadísticamente iguales a cero y, por tanto, se puede asumir que los residuos se comportan como ruido blanco.
Esto significa que los residuos estandarizados varían en torno al neutro, sin tendencia, con varianza constante y no hay valores atípicos. Aproximadamente, el 95% de los residuos estandarizados deben estar entre -2 y 2 desviaciones típicas.
El pronóstico de la demanda turística mensual de la Cadena Hotelera Cubanacán para el año 2019 se muestra en la salida de R de la tabla 3. En esta, se observa el pronóstico a través de intervalos para un 80 y un 95% de confianza.
Mes | Año | Pronóstico | Inf 80 | Sup 80 | Inf 95 | Sup 95 |
---|---|---|---|---|---|---|
Ene | 2019 | 4740.0 | 2924.5 | 6555.0 | 1963.4 | 7516.5 |
Feb | 2019 | 5141.6 | 3326.1 | 6957.0 | 2365.0 | 7918.1 |
Mar | 2019 | 5232.5 | 3417.0 | 7048.0 | 2456.0 | 8009.0 |
Abr | 2019 | 2406.1 | 590.7 | 4221.6 | -370.3 | 5182.7 |
May | 2019 | 3515.7 | 1700.2 | 5331.2 | 739.2 | 6292.2 |
Jun | 2019 | 2880.8 | 1065.3 | 4696.3 | 104.3 | 5657.3 |
Jul | 2019 | 2880.8 | 1065.3 | 4696.3 | 104.3 | 5657.3 |
Ago | 2019 | 2902.5 | 1087.0 | 4717.9 | 125.9 | 5679.0 |
Sep | 2019 | 3203.4 | 1387.9 | 5018.9 | 426.9 | 5979.9 |
Oct | 2019 | 4230.7 | 2415.2 | 6046.1 | 1454.1 | 7007.2 |
Nov | 2019 | 3644.0 | 1828.5 | 5459.4 | 867.4 | 6420.5 |
Dic | 2019 | 3907.0 | 1842.7 | 5971.3 | 749.9 | 7064.1 |
Fuente: Elaboración propia
Mediante la función plot de R, se puede obtener la representación gráfica de la serie demanda turística, con su pronóstico para el próximo año como se puede observar en la figura 5.
Con la metodología Box-Jenkins, se obtuvo el modelo matemático de series temporales que posibilitó modelar la demanda turística en la Cadena Hotelera Cubanacán para el año 2019. El pronóstico de la demanda es pertinente, aun si se agregan los datos referidos al estudio acerca de lo que ha trascurrido de 2020. Obviamente, la situación de la pandemia asociada a la COVID-19 va a introducir guarismos heterogéneos, pero que vendrían a ratificar otros procesos externos que no pueden ignorarse.
En el análisis temporal de la serie, se observa el efecto de la crisis económica mundial y el paso de los huracanes Gustav e Ike por el occidente cubano, se evidencia claramente el impacto negativo en el análisis descriptivo de las series temporales en cuestión para la Cadena Hotelera Cubanacán. Es considerable, además, la influencia beneficiosa del acercamiento en cuanto a relaciones diplomáticas entre Cuba y Estados Unidos durante el período de la presidencia de Barack Obama.
Por consiguiente, los modelos matemáticos de series temporales tienen que estar presentes para una planificación de la actividad económica, de forma que se garantice el proceso de proyección y toma de decisiones de las organizaciones. Es probada su efectividad y fácil utilización luego de creada una metodología amigable para el uso de los decisores, que si bien contempla todos los métodos empíricos y estadísticos-matemáticos empleados, con el rigor científico adecuado, también pueda permitirles, a las cadenas hoteleras, llegar a un pronóstico que garantice una interrelación con todo su entorno local e internacional.