SciELO - Scientific Electronic Library Online

 
vol.17 número2Integración de técnicas de visualización a la metaheurística Algoritmo GenéticoMetodología para el desarrollo de aplicaciones móviles en la Universidad de las Ciencias Informáticas índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Revista Cubana de Ciencias Informáticas

versión On-line ISSN 2227-1899

RCCI vol.17 no.2 La Habana abr.-jun. 2023  Epub 01-Dic-2023

 

Artículo original

Uso de minería de datos para la desestacionalización de série de datos de precipitación en el municipio de Venezuela

Use of data mining for the seasonal adjustment of the series of precipitation data in the municipality of Venezuela

0000-0001-6422-4298Yoelkis Hernández Víctor1  *  , 0000-0002-5460-1624Enrique Almeida Maldonado1  , 0000-0003-3713-3408Oscar Brown Manrique2 

1 Universidad de Ciego de Ávila Máximo Gómez Báez. Facultad de Informática y Ciencias Exactas. Carretera a Morón Km 9 ½. Ciego de Ávila. Cuba yoelkis, ealmeida}@unica.cu

2Centro de Estudios de Ciencias Hidráulicas. Carretera a Morón Km 9 ½. Ciego de Ávila. Cuba obrown@unica.cu

RESUMEN

El cambio climático, ampliamente influenciado por diversos fenómenos identificados, ha afectado seriamente a diferentes sectores de la sociedad, amenazando la seguridad alimentaria y la productividad, realizar acciones para mitigar o adaptarse es vital en estos tiempos. Actualmente las tecnologías de la información y las comunicaciones juegan un papel importante en la extracción, transformación y carga de datos, por los grandes volúmenes de información almacenados. Muchas son las variables que intervienen en la identificación de cambios climáticos en todos los sectores, específicamente en la investigación se efectúa un análisis de series de datos cronológicos de precipitaciones diarias en el municipio de Venezuela, Ciego de Ávila, las cuales deben desestacionalizarse para mostrar un resultado óptimo para cualquier análisis posterior. Bajo esta premisa, el interés de este trabajo se fundamenta en la construcción de un software utilizando el lenguaje Python y el framework Django que permita desestacionalizar las series de datos cronológicas y permitan agilizar y tomar decisiones sobre la variabilidad del clima utilizando el modelado de datos, para lograr el objetivo se propone el método de los promedios mensuales. La información oficial es del Instituto de Meteorología de Ciego de Ávila, el cual prevé su utilización por los investigadores.

Palabras-clave: Django; Precipitación; Cambio climático; Venezuela

ABSTRACT

Climate change, widely influenced by various identified phenomena, has seriously affected different sectors of society, threatening food security and productivity, taking actions to mitigate or adapt is vital in these times. Currently information and communications technologies play an important role in the extraction, transformation and loading of data, due to the large volumes of stored information. There are many variables that intervene in the identification of climatic changes in all sectors, specifically in the investigation, an analysis of chronological data series of daily rainfall in the municipality of Venezuela, Ciego de Ávila, is carried out, which must be seasonally adjusted to show an optimal result for any further analysis. Under this premise, the interest of this work is based on the construction of a software using the Python language and the Django framework that allows the chronological data series to be seasonally adjusted and to speed up and make decisions about climate variability using data modeling. To achieve the objective, the method of monthly averages is proposed. The official information is from the Institute of Meteorology of Ciego de Ávila, which provides for its use by researchers.

Key words: Django; Precipitation; Climate Change; Venezuela

Introducción

Existen claros signos de que el clima está cambiando, y el cambio climático es uno de los retos más importantes a los que debe enfrentarse una humanidad globalizada. Se registraron incrementos en la temperatura global que no son explicables en su totalidad por causas naturales (Lowe 2017; Concepción, 2017, López,2019). En los estudios hidrológicos, es necesario conocer el valor exacto de las precipitaciones, que se obtienen durante un período determinado, así como tomarse todas las medidas para impedir las pérdidas de los niveles de las precipitaciones por evaporación, efectos del viento y salpicaduras ya que se expresa en función del valor que alcanza sobre una proyección horizontal de la superficie terrestre (Fernández, 2012.).

Actualmente, las tecnologías de la información y la comunicación (TIC) se han convertido en una de las herramientas más significativas para cualquier sector que desee recopilar y analizar de forma eficaz y eficiente los datos generados día a día (Ruiz, 2011). Las TIC permiten procesar de distintas maneras información que puede ser usada en beneficio para la sociedad

El clima constituye uno de los recursos naturales más apreciados de la Tierra pues posee la propiedad de restablecer constantemente el calor, la humedad, la radiación solar, el viento y otros elementos climáticos. Es, además, un recurso básico del que dependen todos los demás, por lo que cualquier cambio en el mismo repercute sobre la naturaleza y la sociedad (IPCC, 2014).

Los efectos del cambio climático constituyen uno de los principales problemas a los que se enfrenta la sociedad, El cambio climático afecta de manera sensible al sector agropecuario, presentando varios eventos extremos (Artega,2018). Cada vez son más las evidencias científicas que los constatan, manifestándose a través de algunas variables climáticas. Los efectos del cambio climático a nivel mundial determinaron que se agudizarán las sequías, los procesos de desertificación, los fenómenos meteorológicos extremos, los deshielos, la elevación del nivel del mar y el ascenso de las temperaturas (Gallardo,2018)

Para el análisis e identificación del cambio climático se debe contar con una serie cronológica no menos de 30 años de datos continuos recopilados diariamente, los pronósticos a largo plazo sirven para tomar decisiones estratégicas (Gallardo,2018), por lo que se deben proponer nuevos modelos para que los datos sean los más homogéneo posible o utilizar unos ya existente (Quiroga, F et al. 2013). De contar con toda esa serie de datos históricos, organizados cronológicamente se hace necesario identificar la información y el conocimiento que los mismos nos pueden ofrecer. Una de las tecnologías más relevantes de los últimos años para analizar esa abundante información se encuentra la minería de datos (en inglés data mining o DM). Dados los volúmenes de datos de precipitaciones registrados por la estación de Venezuela, en Ciego de Ávila.

En los proyectos de ciencias de datos de carácter exploratorio los resultados son más variado. En este desarrollo se empleó la metodología proceso estándar de la industria cruzada para la minería de datos CRISP-DM (en ingles Cross Industry Standard Process for Data Mining), (Martínez, 2019). La cual está formada por seis fases, la comprensión del negocio, la comprensión de los datos, la preparación de los datos, el modelado y la evaluación (Chapman et al. 2000), figura 1.

Fig. 1 - Modelo del Proceso CRISP-DM. 

La variabilidad y el cambio climático están teniendo fuertes repercusiones sobre diferentes variables meteorológicas; induciendo cambios en el patrón de precipitación (Olivares, 2018). La variabilidad estacional y anual de la serie temporal de precipitaciones se determinó según (Arrastia, Limia,2011) y el sistema informático para la desestacionalización de las precipitaciones se desarrolló mediante un sistema web en el lenguaje de programación Python (Vidal,2021), que utilizando el método de los promedios mensuales para desestacionalizar las series de cronológica de datos de precipitaciones de todos los pluviómetros de cualquier municipio de una forma rápida y muestre el comportamiento de una variable meteorológica cuantitativa en el pasado para estimar su comportamiento en el futuro, logrando una mayor utilidad para la toma de decisiones dado la influencia que el cambio climático promueve y se precisa de medidas urgente en el futuro.

Por la complicación en el análisis de las series cronológicas de datos y las herramientas necesarias, muchos son los investigadores deben usar varios softwares para realizar varias tareas para lograr los resultados deseados. La aplicación desarrollada se vuelve una alternativa necesaria. En este trabajo se presentará la versión 1.0 del software INFO_CLIM.

Metodología Computacional

En la práctica existen muchos procedimientos para desestacionalizar una serie de tiempo, el método utilizado es el de los promedios mensuales, este fue el implementado durante la v1.0 del sistema INFO_CLIM. La investigación se desarrolla en el Municipio de Venezuela de la provincia de Ciego de Ávila, con la colaboración del ISMET y el Centro de estudio de la Universidad de Ciego de Ávila.

La metodología para el desarrollo del sistema se realizó en los siguientes pasos, relacionados con la metodología CRISP-DM, inicialmente, entender el negocio, luego:

Para un mejor entendimiento del proceso de gestión de la información en la recolección de las variables meteorológicas. Como base debe cargar una serie cronológica no menos de 30 años de datos continuos recopilados diariamente por cada pluviómetro del territorio. Se realizó la recopilación de los datos, los cuales fueron proporcionados el ISMET. Los registros analizados fueron 194.038, los cuales comprendieron el periodo 1990-2019, como se muestra en la figura 2

La fase 1 se enfoca en la comprensión de los objetivos y exigencias del proyecto desde una perspectiva de negocio, en la fase 2 en la recolección de datos inicial y continúa con las actividades que permiten familiarizarse primero con los datos, identificar sus problemas de calidad, la fase 3 cubre todas las actividades necesarias para construir el conjunto de datos final (los datos que serán provistos por las herramientas de modelado).

Fig. 2 - Datos de la variable precipitación en el Municipio Venezuela. 

Se desarrollo el proceso de selección, limpieza y transformación de datos con el objetivo de proponer de manera clara y precisa un mejor conjunto de datos para posteriormente poder alimentar el modelo de datos figura 3.

Fig. 3 - Modelo de proceso de extracción, limpieza y transformación de datos. 

En la fase 4 se aplican varias técnicas de modelado como fueron la regresión y el modelado estadístico, el primero permitió localizan regularidades dentro de los datos y el segundo estableciendo ecuación matemática de las variables y muestra cómo cambia a medida que lo hacen los parámetros. La fase 5 permite evaluar la calidad desde una perspectiva de análisis de datos y en la fase 6 se implica la explotación de los modelos dentro de un entorno de producción.

Luego de la recopilación de la información registrada u observada en las estaciones meteorológicas se propone a agrupar las precipitaciones diarias registrada, hasta llegar al total de registro de precipitación diaria. Y determinar:

La precipitación total del mes (Ptm).

[TeX:] (1)

donde Pd son los datos recopilados diariamente

Utilizando el método de regresión lineal simple definir la pendiente de la curva b. donde N es el número de año de la serie de datos.

Partiendo de la ecuación de la recta.

[TeX:] (2)

[TeX:] (3)

Determinar el Índice Estacionario (IE).

[TeX:] (4)

Desestacionalizar las series de precipitaciones (Pdes).

[TeX:] (5)

Para el desarrollo del sistema se utilizaron varias tecnologías, específicamente el lenguaje de programación python es muy poderoso y flexible, a la vez que sencillo y fácil de aprender.

Las características del lenguaje de programación Python se resumen como, un lenguaje interpretado, no compilado, usa tipado dinámico, fuertemente tipado; es multiplataforma, lo cual es ventajoso para hacer ejecutable su código fuente entre varios sistemas operativos; además de ser un lenguaje de programación multiparadigma, el cual soporta varios paradigmas de programación como orientación a objetos, estructurada, programación imperativa y, en menor medida, programación funcional (R.L., 2021).

El lenguaje HiperText Markup Languaje (HTML): es un lenguaje que permite describir hipertexto, es decir, texto presentado de forma estructurada y agradable, con vínculos o enlaces. (Casado Vara, R. C. 2019)

La metodología Scrum como un instrumento ágil que nace en la industria desarrolladora de software y tecnología, la misma ha demostrado que su uso, mejora los procesos y procedimientos (Castañeda Sandoval et al. 2021).

La arquitectura de software es necesario para guiar la construcción de un software (Palmero, 2019). Se desarrolla a partir de soluciones probadas, estilos y patrones arquitectónicos además de los patrones de diseño (Mejía, 2021).

Django es conocido como un Framework Modelo-Vista-Template (MTV). En el patrón de diseño MTV. (Adrian Holovaty, 2021), donde se define la capa de acceso a la base de datos, la capa de presentación y la capa de la lógica de negocios.

Resultados y discusión

En la figura 4 se muestra la salida del sistema la gráfica de precipitación desestacionalizada y los valores de los diferentes años, lo que permitió determinar la variabilidad el valor medio de las precipitaciones.

Fig. 4 -Gráfica de precipitación del período estudiado. 

El análisis de la serie de datos temporal de precipitaciones demostró que el factor de ajuste de la serie es similar a la unidad en la figura 5, por lo que el Índice de estacionalidad (IE) es muy similar a los valores promedio hiperanuales de cada uno de los meses del año.

Fig. 5 - Series de precipitación original (Psaño) y desestacionalizadas (Pdaño). 

La variación estacional de las precipitaciones en una escala de tiempo mensual se muestra en la figura 6. Se observa que en los meses de enero, febrero, marzo, noviembre y diciembre presentan valores inferiores a 50 mm, ya en el entorno de 50 a 150 mm se incluyen los meses de abril, julio y octubre y por encima de 150 mm aparecen los meses de más precipitaciones del año mayo, junio, agosto y septiembre.

Fig. 6 - Variabilidad estacional de precipitaciones. 

Las imágenes que se muestran a continuación muestran las principales interfaces de los casos de uso más significativos dado el privilegio de usuario, se gestionan los pluviómetros figura. 7, por cada municipio, en los cuales se registra toda la información recopilada diariamente.

Fig. 7 - Listado de pluviómetros por municipio. 

INFO_CLIM permite mostrar las tablas de las series cronológicamente de datos de precipitaciones por meses y año, teniendo en cuenta las precipitaciones totales anual y los promedios mensuales figura 8.

Fig. 8 -Listado de precipitaciones total anual y promedio mensual. 

Durante el desarrollo de la aplicación se contó con los datos de la estación de Venezuela entregados por el Instituto de meteorología de Ciego de Ávila para las pruebas del sistema

Según la usabilidad del software, los métodos y las técnicas a tener en cuenta para lograr la calidad del mismo son, la seguridad con respecto al manejo de errores, la comprensibilidad, el aprendizaje, la operabilidad, lograr ser un software atractivo y permitir la conformidad a estándares y pautas.

En el proceso de despliegue se utilizó un nodo que interactúa con la aplicación. El cliente desde un navegador puede realizar las peticiones al Servidor Web mediante el protocolo HTTP, el cual interactuando con el servidor de base de datos responderá a las peticiones realizadas.

Con el desarrollo del sistema se generan conocimiento relacionada con los comportamientos de las variables climáticas de una manera más rápida y fiable utilizando métodos estadísticos, limpieza de los datos y menos errores; grafica toda la información relacionada con las variables meteorológicas, una ventaja importante es el valor que se impregna a los académicos e investigadores y a las entidades reguladoras, muestrea, genera y exporta en formato .pdf, .csv y Excel.

Conclusiones

El trabajo de investigación demostró que es factible la adaptación de esquemas de minería de datos, demuestra que la desestacionalización es un procedimiento que apoyado en una base teórica permite que sea de gran aplicación práctica. El uso de los métodos permite lograr resultados relacionados a la variable de precipitación, la cual muestra la variación en el clima. El software desarrollado para el análisis de serie cronológicas de datos de precipitaciones en las diferentes escalas resulta ser una herramienta ágil y útil que para investigadores y académicos.

Agradecimientos

Esta investigación se inserta en el Proyecto Asociado a Programa “Metodología para el uso sostenible de los recursos agua y suelo en el contexto de cambio climático”. Especial agradecimiento al Instituto de Meteorología de Ciego de Ávila y el Centro de Estudios Hidrotécnicos de la Universidad de ciego de Ávila

Referencias

Adrian Holovaty, J. K. (8 de 11 de 2021). El libro de Django 1.0. uniwebsidad . Obtenido de https://uniwebsidad.com/libros/django-1-0/capitulo-5/el-patron-de-diseno-mtv. [ Links ]

Arteaga, L. & Burbano, J. (2018). Efectos del cambio climático: Una mirada al Campo. Revista de Ciencias Agrícolas. 35(2): 79-91. http://www.scielo.org.co/pdf/rcia/v35n2/2256-2273-rcia-35-02-00079.pdf. doi:http://dx.doi.org/10.22267/rcia.183502.93. [ Links ]

Casado Vara, R. C. (2019). Introducción a HTML.https://gredos.usal.es/handle/10366/139647. [ Links ]

Castañeda Sandoval, N. D., Mahecha Ortiz, G. P., Martínez Alban, E., Pérez Lora, C. Y. (2021). Diagnóstico de la aplicación de la metodología Scrum en proyectos del área de desarrollo de software en la empresa Sauco Technologies S.A.S [Universidad EAN]. https://repository.ean.edu.co/handle/10882/10778Links ]

Concepción, P.G. (2017). Indicadores de cambio climático para la evaluación de los impactos sobre las precipitaciones en el municipio majagua. Tesis presentada en opción al título de Ingeniero Hidráulico. Departamento de Ingeniería Hidráulica. Universidad de Ciego de Ávila. Cuba. [ Links ]

Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C. and Wirth, R.(2000). CRISP-DM 1.0. Step-by-step data mining guide. https://www.the-modeling-agency.com/crisp-dm.pdf. [ Links ]

García Rodríguez D., Durán Llacer I,. Lapinel Pedroso B. Cantidad de días con lluvia y eventos significativos de sequía en el centro de Cuba.. Revista cubana de Meteorología. Vol. 26, Núm. 1 (2020). http://rcm.insmet.cu/index.php/rcm/article/view/501/799#B21Links ]

Martínez-Plumed F., et al .(2019), "CRISP-DM veinte años después: de los procesos de minería de datos a las trayectorias de ciencia de datos", en IEEE Transactions on Knowledge and Data Engineering , vol. 33, núm. 8, págs. 3048-3061, doi: 10.1109/TKDE.2019.2962680. [ Links ]

Fernández J. L. U., 2012. Climate change: causes and environmental effects, Académico de Número, Real Academia de Medicina y Cirugía de Valladolid, Valladolid. [ Links ]

Gallardo Ballat Yurisbel (2018) Análisis hidroambiental de áreas agrícolas del municipio venezuela, ciego de ávila, CUBA, Universidad & ciencia; Vol 7, No 2 , http://revistas.unica.cu/index.php/uciencia/article/view/1018. [ Links ]

IPCC, Climate Change: Impacts, Adaptation and Vulnerability, United Kingdom, 2014. https://www.researchgate.net/publication/272150376_Climate_change_2014_impacts_adaptation_and_vulnerability_-_IPCC_WGII_AR5_summary_for_policymakersLinks ]

López Silva Maiquel et al, (2019) INDICADORES DE CAMBIO CLIMÁTICO EN LAS PRECIPITACIONES, Publicación Cuatrimestral. Vol. 4, No 2, Mayo/Agosto, 2019, Ecuador (p. 21-34) [ Links ]

Lowe, R., Stewart-Ibarra, A., Petrova, D., García-Díez, M., Cordova, M., Mejía, R., Regato, M., Rodó, X. (2017). Climate services for health: Predicting the evolution of the 2016 dengue season in Machala, Ecuador.Lancet Planetary Health, 1(4), 142-151. Recuperado de: https://doi.org/10.1016/S2542-5196(17)30064-5. [ Links ]

Arrastia M. A; Limia M. E., Energía y Cambio Climático. Empresa de Gestión del Conocimiento y la Tecnología. La Habana, Cuba: Editorial Academia, pp. 179-189, 2011. [ Links ]

Mejía, J. C. G., Agudelo, F. A. V., & Gil, K. G. (2021). Marco de Trabajo para Seleccionar un Patrón Arquitectónico en el Desarrollo de Software. Revista Ibérica de Sistemas e Tecnologias de Informação, (E43), 568-581. [ Links ]

NUMFOCUS PROJECT, 2021. Pandas. [en línea]. [Consulta: 23 octubre 2021]. Disponible en: Disponible en: https://pandas.pydata.org/. Links ]

NUMPY PROJECT, 2021. NumPy. [en línea]. [Consulta: 23 octubre 2021]. Disponible en: Disponible en: https://numpy.org/ . [ Links ]

Quiroga, F y Chávez, C.B. (2013-10-25.). Desestacionalización de series temporales: Un caso de aplicación a variables de clima. Revista Heurística. pp. 1-20, https://bibliotecadigital.univalle.edu.co/xmlui/handle/10893/6278. [ Links ]

Olivares, B. O. (2018). Condiciones tropicales de la lluvia estacional en la agricultura de secano de Carabobo, Venezuela. LA GRANJA. Revista de Ciencias de la Vida, 27(1), 86-102. [ Links ]

Palmero, M. A. S., Martínez, N. S., & Grass, O. Y. R. (2019). Revisión de elementos conceptuales para la representación de las arquitecturas de referencias de software. Revista Cubana de Ciencias Informáticas, 13(1), 143-157. [ Links ]

R.L., C. (2021). Programación en Python . Obtenido de https://entrenamiento-python-basico.readthedocs.io/es/latest/leccion1/index.htmlLinks ]

Ruiz, J. (2011). Herramientas para la investigación en tecnologías de la información y la comunicación. Casos de estudio. Revisa de Currículum y Formación del Profesorado. pp.139-149. Recuperado de http://www.ugr.es/~recfpro/rev151ART9.pdf. [ Links ]

Vidal-Silva, C. L., Sánchez-Ortiz, A., Serrano, J., & Rubio, J. M. (2021). Experiencia académica en desarrollo rápido de sistemas de información web con Python y Django. Formación universitaria, 14(5), 85-94. [ Links ]

Financiación

Ministerio de Ciencias Tecnologías y Medio Ambiente en la provincia de Ciego de Ávila con fecha de inicio: 2021 y fecha de finalización: 2024.

Recibido: 22 de Diciembre de 2022; Aprobado: 20 de Abril de 2023

*Autor para la correspondencia. (yoelkis@unica.cu)

Ninguno de los autores manifestó la existencia de posibles conflictos de intereses que debieran ser declarados en relación con este artículo.

Conceptualización: Yoelkis Hernández Victor.

Curación de datos: Yoelkis Hernández Victor

Análisis formal: Oscar Brown Manrique

Adquisición de fondos: Oscar Brown Manrique

Investigación: Yoelkis Hernández Victor.

Metodología: Oscar Brown Manrique

Administración del proyecto: Oscar Brown Manrique

Recursos: Oscar Brown Manrique

Software: Yoelkis Hernández Victor

Supervisión: Enrique Almeida Maldonado

Validación: Enrique Almeida Maldonado

Visualización: Yoelkis Hernández Victor

Redacción - borrador original: Enrique Almeida Maldonado

Redacción - revisión y edición: Yoelkis Hernández Victor

Creative Commons License