Introducción
Existen claros signos de que el clima está cambiando, y el cambio climático es uno de los retos más importantes a los que debe enfrentarse una humanidad globalizada. Se registraron incrementos en la temperatura global que no son explicables en su totalidad por causas naturales (Lowe 2017; Concepción, 2017, López,2019). En los estudios hidrológicos, es necesario conocer el valor exacto de las precipitaciones, que se obtienen durante un período determinado, así como tomarse todas las medidas para impedir las pérdidas de los niveles de las precipitaciones por evaporación, efectos del viento y salpicaduras ya que se expresa en función del valor que alcanza sobre una proyección horizontal de la superficie terrestre (Fernández, 2012.).
Actualmente, las tecnologías de la información y la comunicación (TIC) se han convertido en una de las herramientas más significativas para cualquier sector que desee recopilar y analizar de forma eficaz y eficiente los datos generados día a día (Ruiz, 2011). Las TIC permiten procesar de distintas maneras información que puede ser usada en beneficio para la sociedad
El clima constituye uno de los recursos naturales más apreciados de la Tierra pues posee la propiedad de restablecer constantemente el calor, la humedad, la radiación solar, el viento y otros elementos climáticos. Es, además, un recurso básico del que dependen todos los demás, por lo que cualquier cambio en el mismo repercute sobre la naturaleza y la sociedad (IPCC, 2014).
Los efectos del cambio climático constituyen uno de los principales problemas a los que se enfrenta la sociedad, El cambio climático afecta de manera sensible al sector agropecuario, presentando varios eventos extremos (Artega,2018). Cada vez son más las evidencias científicas que los constatan, manifestándose a través de algunas variables climáticas. Los efectos del cambio climático a nivel mundial determinaron que se agudizarán las sequías, los procesos de desertificación, los fenómenos meteorológicos extremos, los deshielos, la elevación del nivel del mar y el ascenso de las temperaturas (Gallardo,2018)
Para el análisis e identificación del cambio climático se debe contar con una serie cronológica no menos de 30 años de datos continuos recopilados diariamente, los pronósticos a largo plazo sirven para tomar decisiones estratégicas (Gallardo,2018), por lo que se deben proponer nuevos modelos para que los datos sean los más homogéneo posible o utilizar unos ya existente (Quiroga, F et al. 2013). De contar con toda esa serie de datos históricos, organizados cronológicamente se hace necesario identificar la información y el conocimiento que los mismos nos pueden ofrecer. Una de las tecnologías más relevantes de los últimos años para analizar esa abundante información se encuentra la minería de datos (en inglés data mining o DM). Dados los volúmenes de datos de precipitaciones registrados por la estación de Venezuela, en Ciego de Ávila.
En los proyectos de ciencias de datos de carácter exploratorio los resultados son más variado. En este desarrollo se empleó la metodología proceso estándar de la industria cruzada para la minería de datos CRISP-DM (en ingles Cross Industry Standard Process for Data Mining), (Martínez, 2019). La cual está formada por seis fases, la comprensión del negocio, la comprensión de los datos, la preparación de los datos, el modelado y la evaluación (Chapman et al. 2000), figura 1.
La variabilidad y el cambio climático están teniendo fuertes repercusiones sobre diferentes variables meteorológicas; induciendo cambios en el patrón de precipitación (Olivares, 2018). La variabilidad estacional y anual de la serie temporal de precipitaciones se determinó según (Arrastia, Limia,2011) y el sistema informático para la desestacionalización de las precipitaciones se desarrolló mediante un sistema web en el lenguaje de programación Python (Vidal,2021), que utilizando el método de los promedios mensuales para desestacionalizar las series de cronológica de datos de precipitaciones de todos los pluviómetros de cualquier municipio de una forma rápida y muestre el comportamiento de una variable meteorológica cuantitativa en el pasado para estimar su comportamiento en el futuro, logrando una mayor utilidad para la toma de decisiones dado la influencia que el cambio climático promueve y se precisa de medidas urgente en el futuro.
Por la complicación en el análisis de las series cronológicas de datos y las herramientas necesarias, muchos son los investigadores deben usar varios softwares para realizar varias tareas para lograr los resultados deseados. La aplicación desarrollada se vuelve una alternativa necesaria. En este trabajo se presentará la versión 1.0 del software INFO_CLIM.
Metodología Computacional
En la práctica existen muchos procedimientos para desestacionalizar una serie de tiempo, el método utilizado es el de los promedios mensuales, este fue el implementado durante la v1.0 del sistema INFO_CLIM. La investigación se desarrolla en el Municipio de Venezuela de la provincia de Ciego de Ávila, con la colaboración del ISMET y el Centro de estudio de la Universidad de Ciego de Ávila.
La metodología para el desarrollo del sistema se realizó en los siguientes pasos, relacionados con la metodología CRISP-DM, inicialmente, entender el negocio, luego:
Para un mejor entendimiento del proceso de gestión de la información en la recolección de las variables meteorológicas. Como base debe cargar una serie cronológica no menos de 30 años de datos continuos recopilados diariamente por cada pluviómetro del territorio. Se realizó la recopilación de los datos, los cuales fueron proporcionados el ISMET. Los registros analizados fueron 194.038, los cuales comprendieron el periodo 1990-2019, como se muestra en la figura 2
La fase 1 se enfoca en la comprensión de los objetivos y exigencias del proyecto desde una perspectiva de negocio, en la fase 2 en la recolección de datos inicial y continúa con las actividades que permiten familiarizarse primero con los datos, identificar sus problemas de calidad, la fase 3 cubre todas las actividades necesarias para construir el conjunto de datos final (los datos que serán provistos por las herramientas de modelado).
Se desarrollo el proceso de selección, limpieza y transformación de datos con el objetivo de proponer de manera clara y precisa un mejor conjunto de datos para posteriormente poder alimentar el modelo de datos figura 3.
En la fase 4 se aplican varias técnicas de modelado como fueron la regresión y el modelado estadístico, el primero permitió localizan regularidades dentro de los datos y el segundo estableciendo ecuación matemática de las variables y muestra cómo cambia a medida que lo hacen los parámetros. La fase 5 permite evaluar la calidad desde una perspectiva de análisis de datos y en la fase 6 se implica la explotación de los modelos dentro de un entorno de producción.
Luego de la recopilación de la información registrada u observada en las estaciones meteorológicas se propone a agrupar las precipitaciones diarias registrada, hasta llegar al total de registro de precipitación diaria. Y determinar:
La precipitación total del mes (Ptm).
donde Pd son los datos recopilados diariamente
Utilizando el método de regresión lineal simple definir la pendiente de la curva b. donde N es el número de año de la serie de datos.
Partiendo de la ecuación de la recta.
Determinar el Índice Estacionario (IE).
Desestacionalizar las series de precipitaciones (Pdes).
Para el desarrollo del sistema se utilizaron varias tecnologías, específicamente el lenguaje de programación python es muy poderoso y flexible, a la vez que sencillo y fácil de aprender.
Las características del lenguaje de programación Python se resumen como, un lenguaje interpretado, no compilado, usa tipado dinámico, fuertemente tipado; es multiplataforma, lo cual es ventajoso para hacer ejecutable su código fuente entre varios sistemas operativos; además de ser un lenguaje de programación multiparadigma, el cual soporta varios paradigmas de programación como orientación a objetos, estructurada, programación imperativa y, en menor medida, programación funcional (R.L., 2021).
El lenguaje HiperText Markup Languaje (HTML): es un lenguaje que permite describir hipertexto, es decir, texto presentado de forma estructurada y agradable, con vínculos o enlaces. (Casado Vara, R. C. 2019)
La metodología Scrum como un instrumento ágil que nace en la industria desarrolladora de software y tecnología, la misma ha demostrado que su uso, mejora los procesos y procedimientos (Castañeda Sandoval et al. 2021).
La arquitectura de software es necesario para guiar la construcción de un software (Palmero, 2019). Se desarrolla a partir de soluciones probadas, estilos y patrones arquitectónicos además de los patrones de diseño (Mejía, 2021).
Django es conocido como un Framework Modelo-Vista-Template (MTV). En el patrón de diseño MTV. (Adrian Holovaty, 2021), donde se define la capa de acceso a la base de datos, la capa de presentación y la capa de la lógica de negocios.
Resultados y discusión
En la figura 4 se muestra la salida del sistema la gráfica de precipitación desestacionalizada y los valores de los diferentes años, lo que permitió determinar la variabilidad el valor medio de las precipitaciones.
El análisis de la serie de datos temporal de precipitaciones demostró que el factor de ajuste de la serie es similar a la unidad en la figura 5, por lo que el Índice de estacionalidad (IE) es muy similar a los valores promedio hiperanuales de cada uno de los meses del año.
La variación estacional de las precipitaciones en una escala de tiempo mensual se muestra en la figura 6. Se observa que en los meses de enero, febrero, marzo, noviembre y diciembre presentan valores inferiores a 50 mm, ya en el entorno de 50 a 150 mm se incluyen los meses de abril, julio y octubre y por encima de 150 mm aparecen los meses de más precipitaciones del año mayo, junio, agosto y septiembre.
Las imágenes que se muestran a continuación muestran las principales interfaces de los casos de uso más significativos dado el privilegio de usuario, se gestionan los pluviómetros figura. 7, por cada municipio, en los cuales se registra toda la información recopilada diariamente.
INFO_CLIM permite mostrar las tablas de las series cronológicamente de datos de precipitaciones por meses y año, teniendo en cuenta las precipitaciones totales anual y los promedios mensuales figura 8.
Durante el desarrollo de la aplicación se contó con los datos de la estación de Venezuela entregados por el Instituto de meteorología de Ciego de Ávila para las pruebas del sistema
Según la usabilidad del software, los métodos y las técnicas a tener en cuenta para lograr la calidad del mismo son, la seguridad con respecto al manejo de errores, la comprensibilidad, el aprendizaje, la operabilidad, lograr ser un software atractivo y permitir la conformidad a estándares y pautas.
En el proceso de despliegue se utilizó un nodo que interactúa con la aplicación. El cliente desde un navegador puede realizar las peticiones al Servidor Web mediante el protocolo HTTP, el cual interactuando con el servidor de base de datos responderá a las peticiones realizadas.
Con el desarrollo del sistema se generan conocimiento relacionada con los comportamientos de las variables climáticas de una manera más rápida y fiable utilizando métodos estadísticos, limpieza de los datos y menos errores; grafica toda la información relacionada con las variables meteorológicas, una ventaja importante es el valor que se impregna a los académicos e investigadores y a las entidades reguladoras, muestrea, genera y exporta en formato .pdf, .csv y Excel.
Conclusiones
El trabajo de investigación demostró que es factible la adaptación de esquemas de minería de datos, demuestra que la desestacionalización es un procedimiento que apoyado en una base teórica permite que sea de gran aplicación práctica. El uso de los métodos permite lograr resultados relacionados a la variable de precipitación, la cual muestra la variación en el clima. El software desarrollado para el análisis de serie cronológicas de datos de precipitaciones en las diferentes escalas resulta ser una herramienta ágil y útil que para investigadores y académicos.