Introducción
El cambio climático consiste en la modificación a escala global o local del clima con respecto al historial climático. Ejemplo de estas transformaciones son el aumento de las temperaturas a causa de los gases de efecto invernadero, lo que incrementa el riesgo de sequias e incendios; el aumento de la frecuencia y severidad de las inundaciones, dado que las precipitaciones son mucho más intensas aunque sean menos frecuentes; el incremento de las temperaturas y las variaciones en la humedad puede ocasionar la proliferación de enfermedades en zonas donde antes no existían; el aumento en la severidad y la frecuencia de las olas de calor pone en riesgo la vida de miles de personas; y por último el aumento del nivel del mar debido al derretimiento de los casquetes polares, lo cual da origen a inundaciones más frecuentes y severas (IPCC, 2007, 2014).
Ante esta situación se hace necesario para el ser humano el adaptarse al clima cambiante, y parte de esta adaptación consiste en la mejora de las capacidades de predicción, para poder asegurar la seguridad tanto de las personas como de la infraestructura. Con este objetivo la comunidad científica ha llevado a cabo numerosos estudios estadísticos con el fin de brindar la información necesaria. Por ejemplo: para la construcción de una presa se necesita saber el caudal de agua que debe ser capaz de soportar, lo cual se ve afectado por las intensas lluvias e inundaciones; los cultivos necesitan de un determinado rango de temperatura y ciertas características de humedad para poder germinar apropiadamente; para la construcción de parques eólicos es necesario un estudio de las características del viento en la zona; y a fin de evitar pérdidas humanas con los eventos meteorológicos extremos como los huracanes, tifones y tornados se hace necesario ser capaz de predecir el comportamiento e intensidad de los mismos (IPCC,2007).
Para poder sentar las bases para proveer una mirada objetiva y científica al cambio climático la Organización de Naciones Unidas (ONU) creó el Panel Intergubernamental del Cambio Climático (IPCC) en 1988. Este panel realiza una exhaustiva evaluación de los eventos extremos como el incremento de días y noches cálidas, la escalada de las olas de calor y los cambios en la frecuencia e intensidad de sequias y huracanes, entre otro [IPCC, 2014]. Para ello un grupo de expertos formuló un conjunto de 27 indicadores para detectar variaciones en el comportamiento del clima. Estos indicadores tienen como propósito la estimación de los cambios en los extremos a partir de una metodología común, con el fin de proveer una base comparativa global.
El Instituto de Meteorología ha realizado algunos estudios sobre el comportamiento de los indicadores de extremo. Sin embargo, aún no se ha aplicado la teoría de valores extremos a los indicadores climáticos, ni se cuenta con una herramienta computacional que brinde a los expertos un manejo simplificado de los indicadores para así facilitar su estudio. Dada la complejidad del cómputo y el análisis de los indicadores de extremo, normalmente los investigadores deben usar más de un programa, cada uno con tareas específicas, para lograr los resultados deseados. Además, estos softwares no son libres y son de difícil adquisición, por lo que es necesaria una versión propia, desarrollada para el Instituto de Meteorología. Este problema motivó el siguiente trabajo, donde se busca crear una herramienta computacional, centrada en la aplicación de la teoría de valores extremos a los indicadores, que brinde facilidades tanto para el cálculo como para el análisis de los indicadores de extremos climáticos a través de métodos estadísticos. En este trabajo se describe un software y las herramientas empleadas para su desarrollo. Se especifica su funcionamiento y la metodología a utilizar en datos de variables climáticas extremas.
Este software es muy importante para el Instituto de Meteorología (INSMET) y en especial para el Centro del Clima (CENCLIM) para brindar servicios sobre la caracterización de las variables extremas en diferentes esferas como la construcción de obras, la planificación urbana, la agricultura, para la hidrología. Además, para El Estado Mayor de la Defensa Civil, debido a que ellos son los encargados de la toma de decisiones ante la ocurrencia de un evento extremo, previniendo a la población evitando así las pérdidas de vidas humanas y la disminución de las pérdidas materiales.
El artículo se estructuró en 3 epígrafes, el primero trata sobre Indicadores de Cambio Climático extremo, el segundo sobre la Teoría de Valores Extremos y las pruebas estadísticas y el último define la metodología a usar en este tipo de problema.
1. Indicadores de Cambio Climático Extremo
En este epígrafe se exponen los distintos métodos estadísticos usados en el desarrollo del software, así como una breve explicación de la base teórica de los mismos. Se tiene en cuenta el comportamiento de los Indicadores de Extremos Climáticos de series diarias de temperatura máxima, temperatura mínima y precipitación. Estos datos se obtienen de la base de datos del Centro del Clima del Instituto de Meteorología, así como de las series diarias de precipitación de la red pluviométrica del Instituto Nacional de Recursos Hidráulicos. Para lograr un mejor análisis se utilizan algunos fundamentos de la teoría de valores extremos, como son: la Distribución del Máximo, el Teorema de Convergencia a Familias y la Distribución Generalizada de Valores Extremos de Gumbel, Fréchet y Weibull. Para un análisis más profundo de los datos se analiza también la existencia de tendencia, puntos de cambio y los períodos de retorno.
El Panel Intergubernamental de Expertos sobre el Cambio Climático (IPCC) en su cuarto informe realiza una exhaustiva evaluación de los eventos extremos desde el incremento de días y noches cálidas, de las olas de calor, cambios en la frecuencia e intensidad de sequias y huracanes, entre otros (IPCC, 2007). Para ello se definieron indicadores mediante los cuales se pueden identificar o encontrar las evidencias del cambio del clima (IPCC, 2014).
Un Indicador es un procedimiento que permite cuantificar o relaciona un fenómeno con una escala. Sirve para “indicar” o sugerir la existencia de ciertas características del fenómeno en estudio. A menudo es utilizable para registrar los cambios en dicho fenómeno (Bautista et al., 2013).
Los indicadores de cambio climático tienen el objetivo de ser elementos matemáticos que se utilizan para identificar, registrar, conocer y hacer evidente el cambio climático (IPCC, 2007). Posteriormente se relacionan dichos cambios con las respuestas de los organismos, con la producción agrícola, ganadera y forestal, con aspectos de salud y con los riesgos ambientales (Burgos y González, 2012).
Hay indicadores relacionados con las temperaturas extremas (Tabla 1):
Indicador | Significado |
---|---|
FD0 | Días con helada (Frost Days). Sea |
SU25 | Días de verano (Summer Days). Sea |
ID0 | Días con hielo (Icing Days). Sea |
TR20 | Noches tropicales (Tropical Nights). Sea |
GSL | Estación de crecimiento (Growing Season Length). Sea |
TXx | Temperatura máxima extrema. Sea |
TNx | Temperatura mínima más alta. Sea |
TXn | Temperatura máxima más alta, mínimo valor alcanzado por la temperatura máxima. Sea |
TNn | Temperatura mínima extrema, mínimo valor alcanzado por la temperatura mínima. Sea |
Tn10p | Frecuencia de noches frías, porciento de noches que se encuentran por debajo del percentil 10 de temperatura mínima. Sea |
Tx10p | Frecuencia de días frescos, porciento de días que se encuentran por debajo del percentil 10 de temperatura máxima. Sea |
Tn90p | Frecuencia de noches cálidas, porciento de noches que se encuentran por encima del percentil 90 de temperatura mínima. Sea |
Tx90p | Frecuencia de días cálidos, porciento de días que se encuentran por encima del percentil 90 de temperatura máxima. Sea |
WSDI | Duración de los períodos cálidos (Warm Spells Duration Index), suma de los períodos con al menos 6 días con temperatura superior al 90 percentil. Sea |
CSDI | Duración de los períodos fríos (Cold Spells Duration Index), suma de los períodos con al menos 6 días con temperatura inferior al 10 percentil. Sea |
DTR | Intervalo diurno de temperatura (Diurnal Temperature Range), promedio de la diferencia entre la temperatura máxima y la mínima. Sean |
DC40 | Días con temperatura máxima superior o igual a 40 °C. Sea |
RX1day | Precipitación máxima en un día, máximo valor alcanzado por las precipitaciones en un día. Sea |
RX5day | Precipitación máxima en 5 días, máximo de la suma de las precipitaciones agrupadas en períodos de 5 días. Sea |
SDII | Índice simple de intensidad diaria (Simple Daily Intensity Index), promedio de las precipitaciones superiores a 1 mm. Sea |
R10 | Días con precipitación mayor a 10mm. Sea |
R20 | Días con precipitación mayor a 20mm. Sea |
CDD | Días secos consecutivos (Consecutive Dry Days), mayor número de días consecutivos con precipitaciones inferiores a 1 mm. Sea |
CWD | Días húmedos consecutivos (Consecutive Wet Days), mayor número de días consecutivos con precipitaciones superiores a 1 mm. Sea |
R95pTOT | Días muy húmedos, suma de las precipitaciones por encima del 95 percentil. Sea |
R99p | Días extremadamente húmedos, suma de las precipitaciones por encima del 99 percentil. Sea |
PRCPTOT | Precipitación total, suma de todas las precipitaciones. Sea |
2. Teoría de Valores Extremos y pruebas estadísticas
2.1. Teoría de Valores Extremos para el cálculo de Períodos de Retorno
La Teoría de Valores Extremos ha emergido en los últimos 50 años como una de disciplinas estadísticas más importantes para la ciencia aplicada. Sus técnicas se han esparcido a lo largo de muchos campos. Por ejemplo: las empresas de seguros, asesoramiento de riesgo en el mercado financiero y en la predicción de tráfico en las telecomunicaciones. El análisis estadístico de valores extremos es comúnmente empleado para predecir los períodos de retorno de dichos valores extremos. La característica distintiva del análisis de valores extremos es el objetivo de cuantificar el comportamiento estocástico de un proceso que alcanza valores inusualmente altos, o bajos. El análisis de valores extremos usualmente requiere estimar la probabilidad de eventos que son más extremos que cualquiera que ya haya sido observado.
La Teoría de Valores Extremos se centra en el comportamiento estadístico de
Si bien en la teoría la distribución de
En la práctica esto no resulta útil ya que la función de distribución F es desconocida.
El Teorema de Tipos Extremales encapsula el rango de posibles distribuciones límite de
la cual es una normalización lineal de
2.1.1 Teorema de Tipos Extremales:
Si existe una secuencia de constantes
Donde
Para los parámetros
Colectivamente a estas tres clases de distribución se les conoce como distribuciones de valores extremos, con los tipos 1, 2 y 3 siendo conocidos como las familias Gumbel, Fréchet y Weibull. Cada familia tiene un parámetro de localización b y otro de escala a respectivamente, adicionalmente los casos Fréchet y Weibull tienen un parámetro de forma α (Coles, 2001) (Medialdea, 2016).
En las primeras aplicaciones de la teoría de extremo era usual adoptar una de estas tres familias, para luego estimar los parámetros relevantes a esta distribución. Este enfoque tiene dos problemas, primeramente, es necesario un amplio conocimiento de los procesos para poder determinar cuál de las familias se ajusta mejor a los datos en cuestión y, además, una vez que se tome la decisión, cualquier inferencia posterior presume que la elección es correcta y no tiene en cuenta las desviaciones que puedan existir debido a esta elección.
2.1.2 Distribución Generalizada de Valores Extremos
Para corregir los problemas antes mencionados se unifican las tres familias originales de la distribución de valores extremos en una reformulación conocida como Distribución Generalizada de Valores Extremos (GEV por sus siglas en inglés):
Definida sobre el conjunto
Este modelo tiene tres parámetros: un parámetro de localización
Esta unificación simplifica la implementación estadística, ya que
2.1.3 Estimación de los parámetros
Los L momentos fueron introducidos por Jonathan RM Hosking en 1990 para caracterizar las funciones de distribución. La aplicación de L momentos al análisis de extremos ha sido investigado por muchos investigadores desde sus inicios.
Momentos LH, una generalización de L momentos, son introducidos para caracterizar mejor las secciones superiores de una distribución, así como la ocurrencia de eventos mayores a partir de los datos. Los momentos LH propuestos están basados en combinaciones lineales de estadísticas de orden superior (Wang, 1997).
Los momentos LH se definen como:
Donde
Luego del cálculo de los momentos LH se pasa a calcular los parámetros de la GEV. Primeramente, se halla:
|
|
|
|
|
---|---|---|---|---|
0 | 0.2849 | -1.8213 | 0.8140 | -0.2835 |
1 | 0.4823 | -2.1494 | 0.7269 | -0.2103 |
2 | 0.5914 | -2.3351 | 0.6442 | -0.1616 |
3 | 0.6618 | -2.4548 | 0.5733 | -0.1273 |
4 | 0.7113 | -2.5383 | 0.5142 | -0.1027 |
Luego se hallan las estimaciones de
Para
Para
Donde
2.1.4 Períodos de Retorno
En los estudios meteorológicos tienen mucha importancia los valores críticos o valores de retorno, ya que permiten prepararse con antelación a eventos de gran magnitud. Son considerados como los cuantiles de la distribución de valores extremos. Si el período de retorno
Sea 𝑋 una variable aleatoria continua con función de distribución (𝑥), la probabilidad prefijada
2.2 Análisis de Tendencia: Dócima de Kendall-Mann
El análisis de tendencia de una variable meteorológica es un procedimiento estadístico que, mediante pruebas de hipótesis, explica el cambio de la variable, arroja la tasa de cambio respecto al tiempo, ayuda a identificar regiones y épocas vulnerables a dichos cambios; y ayuda a conocer si el clima está cambiando o se mantiene estable.
Generalmente se utilizan dos métodos no paramétricos para demostrar la posible existencia de tendencia: uno está basado en el coeficiente de correlación de Spearman y el otro es la dócima de Kendall-Mann.
Kendall-Mann es un método estadístico basado en el ranking (número de orden) de dos variables, ampliamente usado en estudios de identificación de tendencias en series de variables meteorológicas en cuanto a si son ascendentes o descendentes, pero no cuantifican estas. Además de tendencias detecta saltos. Como antecedente, se puede señalar que ha sido recomendada por la Organización Meteorológica Mundial para su aplicación en series de variables meteorológicas e hidrológicas.
Las observaciones originales
Luego se calculan:
Y se calculan su valor esperado y varianza:
Con esto se obtiene:
La tendencia puede ser creciente o decreciente según
Determinándose así la región crítica, que sería:
Si
Si
La representación gráfica simultanea de los valores de
La serie retrograda
2.3 Dócima de Pettitt para Puntos de Cambio
Dócima de Pettitt es la más común para la detección de puntos de cambio simples en variables con datos continuos. En este caso la hipótesis nula plantea que la serie sigue una o más distribuciones que tienen el mismo parámetro o sea que no existe cambio, contra la hipótesis alternativa que plantea la existencia de un punto de cambio (Roura et al., 2019) (Pettitt, 1978) (Pohlert, 2020).
El test estadístico no paramétrico se define como:
Donde:
En caso de existir punto de cambio, este se encuentra en
Si
Si
3. Metodología
En este capítulo se explica la metodología seguida durante la implementación del software para el cálculo de indicadores de cambio climático extremo (ICCE), la cual consiste en realizar un análisis de tendencia, punto de cambio y período de retorno para el análisis tanto de las variables meteorológicas como de los indicadores de extremos climáticos. Para el análisis de tendencia se emplea la dócima de Kendall-Mann, para la determinación de la existencia de punto de cambio se usa la dócima de Pettitt y para el cálculo de períodos de retorno se utiliza la teoría de valores extremos. Al final del capítulo se discuten los requerimientos computacionales y los detalles de implementación.
Lo novedosos de la metodología implementada en este trabajo yace en que es la primera vez que se aplica la teoría de extremos para el cálculo del período de retorno de los indicadores de extremos climáticos en un estudio del INSMET. Es primera vez también que se emplea la Distribución Generalizada de Valores Extremos (GEV) para realizar dicho análisis, estudios anteriores llevaban a cabo un proceso para seleccionar el modelo que mejor se adapta a los datos, lo cual acarrea posibles errores.
En la concepción de la metodología se consultó a los expertos para facilitarles el uso y comprensión del software tanto en la entrada de los datos recogidos por el INSMET como en el análisis y visualización de los resultados. A fin de ayudar a la comprensión de los resultados obtenidos, se brindan métodos estadísticos orientados al análisis de las propiedades de los mismos. La metodología propuesta se ilustra en la figura 1:
Como se aprecia en la metodología implementada se calculan los indicadores de extremos a partir de los datos suministrados. Además, se da la posibilidad de calcular un grupo de estadígrafos tanto para los datos originales como para los estadígrafos. El análisis de existencia de tendencia y puntos de cambio, así como el cálculo de los períodos de retorno se pude realizar también a los datos originales y a los indicadores. Finalmente, toda esta información, excepto los estadígrafos, puede ser graficada para facilitar su comprensión.
PASO 1. Entrada de datos
Para el cálculo de los indicadores de extremo el software utiliza datos asociados a la temperatura, como son las temperaturas máximas, mínimas y medias de cada período; y otros asociados a las precipitaciones como son la cantidad de precipitaciones en el período, la lluvia máxima en 24 horas y la cantidad de días con lluvia. También se recogen la fecha de la medición y el identificador de la estación de la cual se toman las muestras. La entrada de los datos al programa ocurre a través de ficheros “.csv” que contienen los datos recogidos por el INSMET a lo largo de los años. Estos ficheros contienen la información en formato diario, mensual y anual (Figura 2).
Aunque el INSMET garantiza la completitud y veracidad de los datos suministrados, se decidió verificar que no existan faltantes en los valores de entrada, pues estos deben ser continuos para poder realizar correctamente el cálculo de los indicadores de extremo. En caso de que sea necesario se da una advertencia al usuario de que un dato debe ser rellenado. Para así garantizar la robustez y buen funcionamiento del software.
PASO 2. Cálculo de los indicadores
Una vez se han cargado los datos se pasa a realizar el cálculo de los indicadores de extremo. Para ello el usuario debe seleccionar los indicadores que desea calcular y el período de tiempo en el cual desea calcularlos, mensual o anual. Cabe destacar que este proceso no requiere que el usuario especifique nada respecto a los datos, pues los ficheros contienen toda la información necesaria y el software la selecciona automáticamente. Por ejemplo, para el indicador de noches tropicales (TR), que son aquellas en que la temperatura mínima es superior a los 20 grados, el programa extrae de los datos la columna de temperaturas mínimas y agrupa los datos según el período en el que el usuario eligió (Figura 3).
Al terminar el proceso de cálculo los resultados se muestran agrupados en una tabla ordenada cronológicamente, donde cada celda contiene el valor del indicador para el mes o año según se halla especificado (Figura 4).
PASO 3. Cálculo de estadígrafos
Se le da al usuario la posibilidad de calcular diversos estadígrafos, como lo son la media, la mediana, la varianza, la desviación típica y el coeficiente de variación, entre otros. Esto se hace para brindar al usuario una idea del comportamiento que tienen los datos e indicadores, para facilitar el entendimiento del comportamiento de la información. Para calcular dichos estadígrafos el usuario solo debe seleccionar las variables que desea (Figura 5).
Como resultado se muestra una tabla con los estadígrafos calculados (Figura 6).
PASO 4. Análisis de tendencia
El análisis de tendencia se emplea para determinar si el incremento en los valores de una variable aleatoria es significativo o no. Por ejemplo, si los valores de una variable aleatoria están distribuidos a lo largo de una recta, entonces el análisis de tendencia se basa en si la pendiente de dicha recta se considera pronunciada o no. Por supuesto, para casos no lineales no es tan sencillo determinar la velocidad de incremento, por lo que se emplean métodos más avanzados, basados en pruebas de hipótesis, para determinar si existe tendencia.
Para realizar un análisis de tendencia el usuario debe especificar qué variable o indicador desea analizar, qué método se debe emplear y qué nivel de significación debe ser usado en las pruebas de hipótesis (Figura 7).
Como resultado se muestran los valores calculados durante la ejecución del programa, para que el usuario pueda verificar la ejecución de los mismos, así como la conclusión final de si el indicador seleccionado presenta tendencia o no (Figura 8).
PASO 5. Análisis de punto de cambio
El análisis de puntos de cambio trata de identificar momentos en los cuales la función de distribución de una variable aleatoria, como los indicadores de extremo, cambia. En general el problema yace en detectar si han ocurrido cambios o no y de ser posible identificar el momento en que ocurrió. El principal uso de este análisis es la detección de comportamientos anómalos en las variables aleatorias. Uno de los métodos más usados para la detección de los puntos de cambio es la Dócima de Pettitt.
Al igual que con el análisis de tendencia, para realizar el análisis de punto de cambio el usuario debe especificar qué variable o indicador desea analizar, qué método se debe emplear y qué nivel de significación debe ser usado en las pruebas de hipótesis (Figura 9).
Como resultado se le muestra al usuario los valores calculados, si existe punto de cambio o no, y en caso de que exista se muestra el año en el que se alcanza. Nótese que este análisis se debe realizar a nivel anual debido a que existen marcadas diferencias en los valores de las temperaturas y precipitaciones entre las distintas estaciones del año (Figura 10).
PASO 6. Cálculo de períodos de retorno
Como se explicó anteriormente, el período de retorno es un valor asociado a la probabilidad de ocurrencia de un suceso. Dado un nivel de retorno, que representa el umbral a partir del cual una ocurrencia del suceso se considera relevante, el período de retorno es el tiempo promedio entre dos ocurrencias del suceso que sobrepasan el nivel de retorno.
Al igual que los análisis de tendencia y punto de cambio el usuario debe seleccionar qué variable o indicador desea analizar y especificar si desea realizar un análisis de máximos o mínimos (Figura 11).
Como resultado el usuario obtiene los niveles de retorno para los períodos de 100, 50, 20 y 10 años (Figura 12), así como los parámetros de la Distribución Generalizada, y una tabla en la que se muestran los valores de las funciones de densidad y distribución (Figura 13).
PASO 7. Visualización de la información a través de gráficos
Con excepción del cálculo de estadígrafos, todas las tablas anteriores pueden ser visualizadas en forma de gráficos para facilitar su comprensión. Para ello el usuario solo debe elegir la ventana de gráfico a partir de un botón en la parte superior derecha (Figura 14).
Conclusiones
Se diseñó e implementó una metodología para el análisis de los indicadores de extremo climático. El cálculo de los indicadores puede mostrar un marcado ascenso o descenso en las variables de estudio. El análisis de tendencia puede explicar el cambio de la variable ayudando a conocer si el clima está cambiando o se mantiene estable, se utilizan dos métodos no paramétricos para demostrar la posible existencia de tendencia: uno está basado en el coeficiente de correlación de Spearman y el otro es la dócima de Kendall-Mann. Para la detección de puntos de cambio simples en variables con datos continuos lo más común es usar la Dócima de Pettitt.
Se confeccionó un software (ICCE) el cual resulta ser una herramienta muy útil para el INSMET para realizar servicios para la caracterización de una serie de datos de variables asociadas a eventos climatológicos extremos obteniendo beneficios económicos.
Se recomienda además utilizar el software para estudios de tendencia, punto de cambio y períodos de retorno de otras variables climatológicas que puedan ser de interés. También utilizar el software en todos los Centros Meteorológicos Provinciales (CMP) del país y ampliar en la medida de lo posible la longitud temporal de la serie de datos disponibles, para obtener un mejor resultado.