Pronóstico de la generación eléctrica de sistemas fotovoltaicos. Un inicio en Cuba desde la universidad

GómezRodríguez, Marco Antonio; Gómez Sarduy, Julio Rafael; Lorenzo Ginori, Juan Valentín; Fonte González, Rafael; García Sánchez, Zaid; GómezRodríguez, Marco Antonio; Gómez Sarduy, Julio Rafael; Lorenzo Ginori, Juan Valentín; Fonte González, Rafael; García Sánchez, Zaid

Mi SciELO

Servicios personalizados

Servicios Personalizados

Articulo

Enviar articulo por email

Indicadores

Citado por SciELO

Links relacionados

Similares en SciELO

Otros
Otros

Permalink

Revista Universidad y Sociedad

versión On-line ISSN 2218-3620

Universidad y Sociedad vol.13 no.1 Cienfuegos ene.-feb. 2021 Epub 02-Feb-2021

Articulo original

Pronóstico de la generación eléctrica de sistemas fotovoltaicos. Un inicio en Cuba desde la universidad

Electrical generation forecast of photovoltaic systems. First steps by Cuban Universities

0000-0003-3182-0928Marco Antonio GómezRodríguez¹^*, 0000-0003-3313-6572Julio Rafael Gómez Sarduy¹, 0000-0002-1521-1244Juan Valentín Lorenzo Ginori², 0000-0003-2843-4129Rafael Fonte González³, 0000-0003-1989-9362Zaid García Sánchez¹

^¹Universidad de Cienfuegos “Carlos Rafael Rodríguez”. Cuba

^²Universidad Central “Marta Abreu” de Las Villas. Santa Clara. Cuba

^³OBE Provincial Cienfuegos. Cuba

RESUMEN

La generación solar fotovoltaica está asociada con una alta variabilidad debido a la intermitencia de la radiación solar y otros parámetros climáticos. Esto dificulta la planificación de la generación. Por tanto, el pronóstico preciso a corto plazo de este tipo de generadores es importante para los sistemas de potencia. Este trabajo se refiere al esfuerzo que desde la academia se desarrolla en Cuba para desarrollar este tipo de predictores en el marco del proyecto “Conectando conocimientos” y la colaboración entre la Universidad Central “Marta Abreu” de Las Villas y la Universidad de Cienfuegos “Carlos Rafael Rodríguez”. Se describe un modelo híbrido que combina transformada wavelet con redes neuronales artificiales para pronosticar la generación de potencia fotovoltaica para el día siguiente, a partir de datos históricos del Sistema de Supervisión y Adquisición de Datos (SCADA) y de variables meteorológicas locales. Se trabajó en entorno Matlab y se desarrollaron varias redes neuronales de regresión generalizada y del tipo feedforward backpropagation variando sus parámetros para seleccionar las de mejor desempeño. El modelo se desarrolló y validó para un parque de generación fotovoltaica de 5.5 MW. La precisión se compara con el modelo persistente, revelando mejoras en el rango del 6.66% al 49.71%.

Palabras-clave: Generación fotovoltaica; modelo de predicción; redes neuronales artificiales; transformada wavelet; fuentes renovables de energía

ABSTRACT

Solar photovoltaic generation is marked by high variability due to the intermittency of solar radiation and other climatic parameters. This makes generation planning difficult. Therefore, accurate short-term forecasting of this type of generators is a crucial factor for power systems. This paper explains the efforts made by Cuban experts and academics in the field to develop predictors within the framework of the Connecting Knowledge project, jointly conducted with Marta Abreu Central University of Las Villas and Carlos Rafael Rodriguez University of Cienfuegos. It describes a hybrid model that combines wavelet transform with artificial neural networks to forecast photovoltaic power generation for the following day, by analyzing recorded data provided by the Data Monitoring and Collection System and local meteorological variables. Several generalized regression and feedforward backpropagation neural networks were developed in Matlab environment; their parameters were altered in order to determine the one that performed the best. The resulting model was developed and validated for a 5.5 MW photovoltaic generation park, which accuracy was compared with the generalized model, revealing improvements rates in the range of 6.66% to 49.71%.

Key words: Photovoltaic generation; forecasting models; artificial neural networks; wavelet transform; renewable energy sources

Introducción

La producción de energía, un importante indicador para evaluar el grado de desarrollo alcanzado por el hombre, constituye una de las causas del consumo desmedido de los recursos energéticos no renovables. Solucionar las necesidades energéticas del mundo mediante estos combustibles fósiles tiene como problema la emisión de grandes cantidades de gases de efecto invernadero, como el dióxido de carbono, con el consiguiente impacto ambiental negativo.

Cada día son más las personas que toman conciencia de esto por el daño que se causa al medio ambiente y a la vida humana. Las circunstancias ambientales, que configuran los riesgos actuales derivados del cambio climático y que se manifiestan de distintas formas, obligan a pensar en la sustitución acelerada de los combustibles fósiles para mitigar los desastrosos efectos en marcha desencadenados por los niveles de contaminación ya alcanzados.

Resulta necesario pues, acelerar el proceso de sustitución de los combustibles fósiles por fuentes renovables de energía que puede lograrse ahora mediante modernas tecnologías; pero ello requiere vencer barreras de todo tipo (financieras, económicas, tecnológicas, conductuales, conceptuales, sicológicas, políticas, etc.) que se oponen a dicha sustitución y que hacen que los países en desarrollo no puedan acceder plenamente al uso eficiente de estas fuentes.

Debido a todas estas dificultades y al bajo nivel de partida, la participación de las fuentes renovables de energía, a pesar de que ha crecido significativamente en los últimos años, apenas rebasa el 2.5% globalmente.

En Cuba es de vital importancia el incremento del uso de las fuentes renovables de energía debido al papel estratégico que para el crecimiento del país tiene el desarrollo del sector energético. Esto se debe no solo a las implicaciones que para el medio ambiente tiene el uso de los combustibles fósiles, sino también para alcanzar la independencia energética.

Actualmente en Cuba se satisface alrededor del 96 % de las necesidades energéticas con combustibles fósiles y aproximadamente un 4 % con fuentes renovables. Constituye un programa de gobierno cambiar la matriz energética y producir alrededor de un 24 % de su energía con fuentes renovables para el año 2030. Para alcanzar esta meta, el país está montando parques eólicos y solares fotovoltaicos, así como plantas bioeléctricas.

Ahora bien, dentro de las fuentes renovables, particularmente la solar y la eólica han ganado mayor importancia en los últimos años debido a que son de fácil acceso (disponibles en cualquier lugar), cero emisiones (energías limpias y amistosas con el ambiente) y simples (estructura menos compleja que las fuentes de energía convencional). Esto ha acelerado grandemente la instalación de sistemas solares fotovoltaicos (PV) a nivel global. Sin embargo, la potencia que entrega un sistema de generación PV es estocástica y voluble por naturaleza, en función de la radiación solar y otras variables climáticas. Este comportamiento estocástico crea algunos problemas para la operación segura en las redes de potencia.

El pronóstico de la potencia de salida de los sistemas solares fotovoltaicos también es muy difícil porque está altamente relacionado con las circunstancias externas tales como radiación solar y otros parámetros climáticos que cambian muy rápidamente en una localidad.

Un sistema de pronóstico de la generación PV, que sea preciso, es de mucha utilidad para el despacho de carga de los sistemas de potencia, permitiéndoles que tomen decisiones acertadas sobre aspectos claves tales como el ajuste de las fuentes de generación convencionales, programación de arranques, requerimientos de almacenamiento y planificación en general.

Por lo tanto, el pronóstico de la generación eléctrica de los sistemas solares fotovoltaicos, tanto en las grandes redes de potencia como en las microrredes, juega un papel clave para la operación eficiente, económica, estable y sostenible del suministro de electricidad.

Algunas técnicas han sido desarrolladas recientemente para pronosticar la potencia de salida de los sistemas fotovoltaicos utilizando herramientas de inteligencia artificial y este es un campo de investigación activo.

En Cuba, debido a los planes prospectivos de incremento de la penetración en el Sistema Electroenergético Nacional (SEN) de este tipo de recurso energético, constituye una oportunidad y un reto de desarrollo tecnológico el pronóstico de la generación de electricidad a corto plazo con sistemas PV. En este sentido y bajo los intereses del proyecto “Conectando Conocimientos” liderado por la Universidad Central “Marta Abreu” de Las Villas y en la cual participa el Centro de Estudios de Energía y Medio Ambiente de la Universidad de Cienfuegos “Carlos Rafael Rodríguez”, la universidad cubana aporta sus conocimientos para contribuir a este tipo de investigaciones siendo el objetivo del presente trabajo proponer un modelo híbrido de predicción de la generación de electricidad de un parque solar PV a partir de variables climatológicas.

Desarrollo

A nivel global, la pasada década se caracterizó por un crecimiento continuo en el desarrollo de las tecnologías energéticas renovables ^{(Agencia Internacional de Energía, 2019)}. Esta tendencia ha provocado que el paradigma de los sistemas eléctricos de potencia esté cambiando, de la tradicional cadena de generación, transmisión y distribución, a un modelo donde cada vez más se genera la energía cerca de los consumidores empleando recursos energéticos renovables locales.

En los sistemas eléctricos convencionales, basados en centrales termoeléctricas con combustibles fósiles, estas plantas trabajan con un nivel de salida ajustado y los operadores del sistema eléctrico pueden disponer de estas plantas para proveer una cantidad de electricidad estable y predecible. Además de esto, existen plantas alimentadas con diésel o gas natural que a menudo son diseñadas para permitir un ajuste fino de su salida de electricidad de manera continua. Esto hace que se pueda gestionar el cambio de ajustar el suministro de electricidad a las variaciones de la demanda.

Sin embargo, algunas fuentes renovables de energía (FRE), sobre todo la eólica y solar fotovoltaica, son dependientes de un recurso que fluctúa continuamente. Si el viento disminuye o las nubes oscurecen el sol, entonces la generación disminuye, obligando a los operadores del sistema a poner en marcha otras plantas de electricidad. Es decir, la dependencia que tiene la energía eléctrica generada en un parque PV de las condiciones meteorológicas, y la alta variabilidad de éstas, hacen que el problema de operar un sistema con elevada penetración de parques PV sea una labor compleja. Sobre todo, la naturaleza intermitente de la cobertura de nubes origina que, incluso para horizontes temporales pequeños, sea difícil asegurar cual va a ser exactamente el valor de la radiación incidente sobre el parque en cuestión.

Cuando la generación eólica o solar fotovoltaica es una fracción pequeña de la generación total (poco porcentaje de penetración) se hace más fácil gestionar estas fluctuaciones. Sin embargo, cuando estos “recursos variables” constituyen una fracción importante de la capacidad total del sistema eléctrico, se hace más difícil mantener la estabilidad del sistema y este se torna extremadamente cambiante. Aun cuando el recurso energético renovable sea una pequeña fracción de la capacidad total del sistema, puede suplir una gran parte de la demanda en una escala de tiempo pequeña o en una gran área geográfica (IRENA, 2013).

Es por eso que es importante para el operador del sistema conocer que sucederá con la generación en un tiempo futuro razonable para poder tomar decisiones y lograr el necesario balance generación-carga. O sea, como se plantea en ^{Yang, et al. (2017}), la predicción futura de la potencia a entregar por las plantas de generación PV, puede reducir de manera efectiva los efectos adversos que ocasiona sobre el sistema la conexión a la red de este tipo de fuentes y ayudar a los operadores del sistema a ajustar la planificación en tiempo real así como a poder coordinar la generación de potencia PV y otras fuentes de generación. Todo esto con el fin de alcanzar los requerimientos de operación racional de la red.

Es bueno señalar que el pronóstico de la generación con fuentes renovables no es necesario cuando los niveles de penetración de las FRE son bajos (tanto para la toda la red como para una sección de la red). El recurso renovable empieza a ser notable cuando alcanza entre un 10% y un 15% de penetración en la capacidad del sistema (^{International Renewable Energy Agency, 2013}) y es entonces cuando empieza a hacerse realmente necesaria la predicción de su comportamiento para garantizar el funcionamiento seguro del sistema de energía eléctrica.

En el 2014, se estimó que la penetración fotovoltaica excedía el 1% en 19 países de la Unión Europea (UE), con Italia en primer lugar (7,9%) seguida de Grecia y Alemania con 7,6% y 7% respectivamente. Diferentes escenarios de la Agencia Internacional de Energía (IEA por sus siglas en inglés) predicen que para el 2030 la generación PV alcanzará 1,5-5% del consumo eléctrico global y del 10-25% de la demanda de la UE. Por esta razón, se estableció como obligatorio en muchos países del mundo el pronóstico con un día antes de la generación fotovoltaica (Italia, Alemania, España, Rumania, USA y Japón, entre otros) (^{Pierro, et al., 2016}).

En Cuba, la generación PV ha cubierto aproximadamente el 1,6% de las necesidades energéticas del país. Como ya se mencionó, cuando este tipo de fuente es menor que un 10% de la generación total, no es importante el pronóstico de la misma a corto plazo, pero cuando supera este umbral, se hace necesario pronosticar la contribución de este tipo de fuentes para poder operar correctamente el sistema. Por esta razón es necesario comenzar a investigar esta temática para el desarrollo de modelos de pronóstico de la generación de electricidad a corto plazo con sistemas PV para las condiciones de Cuba.

En resumen, el hecho de que, además de garantizar la demanda, el sistema de potencia tenga que dar respuesta inmediata a los problemas que en él puedan surgir, garantizando el suministro al mayor número de usuarios (obviamente, respetando todas las restricciones técnicas que pueda presentar) es razón más que suficiente para destacar lo importante de disponer de herramientas para la predicción de la producción eléctrica en parques PV, por las repercusiones económicas que un conocimiento previo de los valores de energía generada puede tener en la programación de las centrales eléctricas térmicas, y en la determinación de la reserva de generación y de los cambios en el despacho de las unidades generadoras convencionales.

De manera similar a cualquier otro modelo de pronóstico, los modelos de pronóstico de la generación PV pueden ser clasificados en base a diferentes criterios. Algunos de estos comprenden el horizonte de predicción, la cantidad de datos a predecir y el tipo de modelo (lineal o no lineal) (^{Muñoz, 2014}; ^{Gómez, et al., 2016}).

En cuanto al horizonte de predicción, debe ser contemplado desde el primer momento del diseño. Este horizonte de predicción se refiere al periodo de tiempo que va a determinar el momento futuro para el que se realiza la predicción, contabilizado a partir del instante determinado en que se realiza dicha predicción.

En otros problemas de predicción relacionados con el Sistema Eléctrico, como es el caso de la predicción de la demanda eléctrica, según el valor del horizonte la predicción puede clasificarse como de muy corto plazo, corto plazo, mediano plazo o largo plazo (^{Gómez, et al., 2016}).

Para el caso de la predicción de la potencia eléctrica producida en un parque solar PV, una clasificación en cuanto a horizonte de predicción es la que se da en ^{Muñoz (2014}), y es la siguiente:

Predicciones a muy corto plazo: el horizonte de predicción es de unas horas, no existiendo unanimidad en su valor, entre 4 y 9 horas. Para el operador de la red eléctrica estas predicciones son de interés para el mantenimiento de la seguridad del Sistema Eléctrico.
Predicciones a corto plazo: el horizonte de predicción abarca desde el límite con el muy corto plazo hasta las 48 ó 72 horas. Esta predicción es la de mayor interés para poder actuar en la programación eléctrica diaria. Muchos trabajos publicados se refieren a predicciones con 24 horas de anticipación.
Predicciones a “más largo plazo”: corresponden a un horizonte por encima de las 48 ó 72 horas llegando a un límite de 7 días. Cuanto mayor sea el horizonte, mayores son los errores de predicción, resultando actualmente difícil realizar predicciones fiables de variables atmosféricas por encima de esos 7 días. Estas predicciones (hasta 7 días) pueden ser de interés para la previsión del despacho de centrales eléctricas convencionales, y/o la programación de las labores de mantenimiento en algunas de esas centrales (en la programación del sistema de generación).

Otra clasificación en cuanto al horizonte de tiempo reconoce una categoría más, el cortísimo plazo, para horizontes desde 0,5 a 6 horas y el corto plazo lo fijan en uno o dos días (^{Yang, et al., 2017}).

Es de destacar que la mayor parte de los trabajos publicados que describen modelos de predicción se han centrado en la predicción de la producción eléctrica en un corto plazo, sobre todo para el día siguiente.

En cuanto al segundo criterio de clasificación, se puede plantear que existen modelos de pronóstico de una sola variable o de múltiples variables. Un ejemplo de modelo para la predicción de una única variable son los modelos de pronóstico de la generación de energía promedio diaria como es el caso de ^{Ramsami & Oree (2015}). Modelos con múltiples variables pueden ser los que se encargan de predecir la potencia para cada hora del día siguiente como en ^{Tesfaye, et al. (2018}).

Los modelos lineales, que emplean regresión lineal múltiple para correlacionar variables climáticas y temporales con la generación de un parque PV, tienen como aspecto común, su incapacidad para extender la respuesta para valores de las variables explicativas fuera del rango utilizado para la obtención del modelo y además su pobre desempeño con relación a los modelos no lineales basados en técnicas de inteligencia artificial. Sin embargo, aún se utilizan ampliamente modelos de regresión debido a su simplicidad (^{Ramsami & Oree, 2015}).

No obstante a los criterios anteriores, la clasificación más adecuada para poder comparar los datos de forma apropiada según ^{Muñoz (2014}), es la siguiente:

Modelos basados en valores pasados: utilizan como entrada únicamente valores pasados, pudiendo ser únicamente de la variable a predecir o complementados con otras variables que pueden influir en la misma. Dentro de estas variables se pueden incluir no sólo las correspondientes al instante de tiempo en que se dieron, sino que pueden tratarse de variables meteorológicas medidas localmente en dichos instantes pasados. Este tipo de modelos también es clasificado como métodos estadísticos en ^{Yang, et al. (2017}).
Modelos atmosféricos: los modelos incorporan como entradas los valores de predicción de variables meteorológicas obtenidos por los programas de predicción numérica existentes en diferentes institutos meteorológicos, además, dichas entradas podrán estar complementadas por las indicadas en el grupo anterior. Esta clasificación se conoce también como modelos basados en métodos físicos (^{Yang, et al., 2017}).

Esta investigación se limitó al desarrollo de un modelo basado en valores pasados, es decir valores históricos de las variables acumuladas en el SCADA y en las mediciones de la estación meteorológica local del parque objeto de estudio.

Para desarrollar un modelo de predicción de la potencia fotovoltaica a corto plazo se pueden usar, como entradas a los mismos, las predicciones generadas por otros modelos (modelos atmosféricos locales que predicen el tiempo). A partir de las predicciones de variables tales como radiación solar, temperatura, presión, cobertura de nubes, velocidad y dirección del viento y precipitaciones, fruto de los modelos atmosféricos, se calcula la predicción de la potencia eléctrica generada en un parque solar PV por aproximaciones estadísticas o físicas. Pero la limitación de los modelos de predicción de la producción eléctrica está dada por el hecho de que ellos, en principio, no pueden mejorar las predicciones de los modelos atmosféricos que incurren en errores provocados por un deficiente modelado del terreno o por condiciones iniciales incorrectas y que provocan diferencias importantes entre el pronóstico y la realidad.

Por otro lado, no siempre se dispone de información de modelos atmosféricos, que normalmente es propiedad de los institutos de meteorología, y es necesario recurrir a modelos basados en datos históricos de mediciones para predecir la potencia en un instante de tiempo determinado a partir de variables conocidas para instantes de tiempo previos. Si este es el caso y no se utilizan predicciones históricas de modelos atmosféricos, entonces la variabilidad de las condiciones del tiempo local, sobre todo la cobertura nubosa, introduce grandes incertidumbres. Es por esto que la predicción de la potencia eléctrica generada en el corto plazo por un parque PV constituye una tarea difícil, no exenta de importantes errores. Pero a pesar de esta dificultad, resulta actualmente imprescindible por las implicaciones técnicas y económicas referidas anteriormente.

El pronóstico de la potencia en plantas de energía renovables es un campo de investigación muy activo por su repercusión sobre la operación de los sistemas de potencia. Antes de revisar algunos modelos recientes reportados en la literatura conviene referirse al conocido como modelo persistente.

Al evaluar un modelo de predicción es necesario compararlo con un modelo trivial para comprobar si sus resultados son mejores. En la literatura sobre el tema es común utilizar el llamado modelo persistente para realizar estas comparaciones.

Este modelo supone que la potencia eléctrica generada (o la radiación incidente) para el instante t+k es igual al del instante t como se muestra en la ecuación (1).

Como es de esperar, la efectividad del modelo persistente decrece a medida que aumenta el horizonte de predicción debido a las variaciones meteorológicas por lo que se usa únicamente como una referencia.

Una revisión de la literatura relacionada con el tema revela que hasta el año 2010 la investigación y el desarrollo de modelos de predicción de producción fotovoltaica eran mínimos, además la mayor parte de ellos se basaban en la predicción de la radiación, y se habían publicado pocos modelos de predicción de la producción. A partir de 2011 las publicaciones de nuevos modelos de predicción fotovoltaicos y los estudios acerca de sus características han crecido considerablemente, brindándose una extensa revisión del estado del arte en ^{Muñoz (2014}). En todos los casos, las estrategias utilizadas para el desarrollo del modelo son similares a las utilizadas para pronosticar otras magnitudes de los sistemas eléctricos como carga horaria, carga máxima y precio de la energía en el mercado (^{Rocha & Alves, 2005}; ^{Amjady & Keynia, 2008}, ²⁰⁰⁹, ²⁰¹¹; ^{Sajjad, et al., 2013}; ^{Gómez, et al., 2016}; y ^{Peña, et al., 2019}).

En el 2015 se reporta un trabajo que presenta una nueva técnica para pronosticar, con 24 horas de anticipación, la salida de un generador fotovoltaico de 4 kW ubicado en la cubierta de una edificación en la ciudad de Newquay, Cornwall, Reino Unido (^{Ramsami & Oree, 2015}). El modelo híbrido propuesto por estos autores lo comparan con modelos convencionales de regresión lineal múltiple y redes neuronales artificiales. Primero desarrollan tres modelos simples, uno con una red neuronal de regresión generalizada, otro con una red neuronal feedforward y un tercer modelo de regresión lineal múltiple. La propuesta final realizada por Ramsami & Oree (2015), es hacer modelos híbridos aplicando regresión stepwise para seleccionar las variables de mayor importancia y aplicarlas a los modelos simples anteriormente mencionados. Estos autores logran disminuir la cantidad de variables meteorológicas necesarias, identificando solo los valores medios de la radiación solar y la humedad como los parámetros más significativos para predecir la energía de salida del sistema fotovoltaico. Los resultados de la simulación arrojaron que este modelo hibrido supera los modelos simples con raíz del error cuadrático medio (RMSE) de 2,74 y error absoluto medio (MAE) de 2,09. La principal dificultad del modelo es que requiere pronóstico diario del clima para la localidad y además solo pronostican la energía y no la salida de potencia hora a hora, por lo que no es de utilidad para propósitos de programación de la generación en redes o microrredes.

En ^{Pierro, et al. (2016}), se desarrollan y comparan varios modelos basados en predictores numéricos del clima para predecir la radiación solar y la potencia de un parque fotovoltaico para el día siguiente. Utilizan información de cuatro años de variables climáticas, atmosféricas y de producción de un parque de 662 kWp localizado en Bolzano, Italia. Las variables que emplea como entrada en el modelo con redes neuronales (Perceptrón Multicapa) para la predicción de la potencia horaria son la altitud y el azimut solar, el pronóstico de la temperatura ambiente y del índice de claridad y la radiación global horizontal. Los dos primeros tienen en cuenta el efecto de la posición del sol en el comportamiento de la planta, la temperatura se considera pues la eficiencia de los paneles fotovoltaicos decrece con el incremento de la misma y las dos últimas entradas están relacionadas con la predicción del índice de nubosidad. Después de probar este tipo de modelos con entradas provenientes de diferentes predictores numéricos del clima, promedian los de mejor desempeño y construyen de esta manera lo que denominaron Conjunto Multi-Modelo que mejora considerablemente el comportamiento de los modelos individuales.

El Conjunto Multi-Modelo de ^{Pierro, et al. (2016}), tiene como complejidad adicional que necesita un algoritmo estadístico para corregir los datos de los predictores numéricos del clima. Con este modelo se obtiene un RMSE de 10,5% de la potencia nominal del parque, con valores aún hasta de 46%.

Toda la literatura relacionada con métodos de pronóstico concuerda en que los modelos no lineales tienden a dar mejores predicciones que los modelos lineales en dependencia de la naturaleza del problema que se trate (^{Gómez, et al., 2016}). En ^{Li, et al. (2016}), se propone un modelo de regresión no lineal simple, conocido como Multivariate Adaptive Regression Splines (MARS), como una alternativa para predecir la salida de un sistema fotovoltaico de 2,1 kWp. Este tipo de modelo tiene como ventaja que mantiene la simplicidad de los clásicos modelos de regresión lineal múltiple, mientras posee la capacidad de manipular las no linealidades. Además, tiene un formato más simple que otros modelos no lineales como las redes neuronales artificiales (ANN), árboles de regresión y clasificación (CART) y máquinas de soporte vectorial (SVM). Estos autores comparan el modelo MARS con los modelos anteriormente mencionados y concluyen que puede dar pronósticos confiables. Para el modelo MARS, Li, et al. (2016), utilizan como variables de entrada las horas de sol, la presión, la temperatura máxima y mínima y la cantidad de precipitaciones y durante el procesamiento de los datos emplean un algoritmo de interpolación para completar los datos perdidos que inevitablemente existen debido a fallas en las mediciones o mantenimiento del sistema. Este modelo solo tiene una salida que es la predicción de la potencia media del día siguiente.

En ^{Yang, et al. (2017}), se reporta un método para la predicción de la potencia de salida de una instalación fotovoltaica para cada hora del día siguiente. Este modelo realiza un análisis estadístico de los datos históricos de la potencia generada y realiza un agrupamiento para obtener matrices similares de días similares bajo diferentes condiciones climáticas. El modelo propuesto por Yang, et al. (2017), es una fusión de este agrupamiento estadístico con el modelo de pronóstico persistente que es un modelo trivial y su objetivo es tratar de resolver el problema de datos incompletos y limitados en las instalaciones fotovoltaicas. El resultado de este modelo es una curva típica de generación para las 24 horas del día siguiente con límites inferior y superior lo que realmente da una zona de valor probable de la potencia generada.

Otros experimentos se han conducido en Alemania para pronosticar el comportamiento de un amplio rango de 21 instalaciones fotovoltaicas desde pequeños generadores instalados en cubiertas de edificios hasta grandes parques de 8,5 MW. Para ello se emplearon variantes de deep learning con datos históricos de predictores numéricos del clima.

Una de las tendencias en la modelación ha sido hacer modelos híbridos combinando diferentes técnicas para mejorar los resultados. Una de estas variantes empleadas en los sistemas eléctricos es descomponer las series temporales con transformada wavelet (WT) y combinarlas con otras herramientas (^{Amjady & Keynia, 2008}, ²⁰⁰⁹; ^{Sajjad, et al., 2013}; ^{Sudheer & Suseelatha, 2014}).

Una combinación entre transformada wavelet discreta (DWT) y máquina de soporte vectorial de soporte vectorial (SVM) aparece en ^{Tesfaye, et al. (2018}). En este caso el modelo de predicción es para las 24 horas del día siguiente y se obtiene una elevada precisión, pero necesita no solo los valores históricos de producción del SCADA, sino históricos de pronósticos meteorológicos de modelos de predicción numérica del clima. Los datos de entrada son tratados mediante la DWT antes de convertirse en las entradas de la SVM, cuya salida es posteriormente recompuesta. En este caso las entradas son las predicciones históricas de radiación solar, temperatura, nubosidad, humedad, presión y velocidad del viento y los históricos de producción tomados del SCADA. Una complejidad adicional es que adicionan un algoritmo de enjambre de partículas (PSO) para la selección de los parámetros óptimos de la SVM.

Para horizontes de pronóstico de corto plazo (hasta dos días) la mayoría de los investigadores emplean modelos numéricos de predicción meteorológica del tiempo, conocidos como Numerical Weather Prediction (NWP) Models.

Los NWP son las herramientas más eficaces para plazos superiores a las cinco o seis horas, ya que ellos permiten pronosticar numerosas variables meteorológicas incluyendo la radiación solar debido a que se modela el comportamiento de la física atmosférica utilizando las leyes de conservación de la masa, el momento y la energía. No obstante, como se concluye en ^{Muñoz (2014}), su eficacia y sus errores están ligados a la eficacia de las predicciones del modelo atmosférico en cuestión. Para reducir los errores de dichas predicciones se aumenta la resolución del modelo atmosférico o se aplican filtros. En Cuba se ha investigado en la mejora del pronóstico de radiación solar utilizando este tipo de modelos con técnicas de post-procesamiento que se aplican a su salida, específicamente la técnica Model Output Statistics (MOS) (^{Borrajero, et al., 2016}).

Aunque se aprecia una tendencia al empleo de NWP, se han desarrollado modelos incluso que prescinden de utilizar datos de clima (^{González, et al., 2016}). Este tipo de modelos dan la posibilidad de obtener pronósticos razonables a partir solamente de valores de la potencia generada en instantes pasados y pueden ser usados como una línea base para comparar modelos más complejos.

La revisión del estado del arte realizada por Muñoz (2004), deja patente que los modelos basados únicamente en datos históricos se usan tanto para plazos muy cortos (menos de tres a cuatro horas) como para horizontes en torno a las 24 horas.

En esta investigación se tomó como caso de estudio un parque PV conectado a red con capacidad instalada de 5,5 MWp. El mismo cuenta con 19 400 paneles fotovoltaicos conectados en 5 arreglos con dos inversores cada uno. La generación promedio diaria de esta instalación fotovoltaica es de 26 MWh aproximadamente. Para su correcta explotación, cuenta con un sistema SCADA en el que se registran las mediciones de potencia horaria (MW) entre otras variables eléctricas y operacionales como la temperatura de los módulos. Además, cuenta con una pequeña estación meteorológica con instrumentación para medir variables como temperatura ambiente (^oC), velocidad del viento (m/s) y radiación solar incidente (W/m²).

En esta investigación se considera como potencia de salida del parque la suma de las mediciones de potencia de cada inversor, es decir se desarrolla un modelo para la generación total de la instalación.

Las etapas para la modelación realizada se describen brevemente a continuación:

Recopilación de datos: Obtener los datos históricos de las variables de interés, entre las que debe estar, obligatoriamente, la variable que el modelo tiene la finalidad de predecir, ya que será la que permita desarrollar y evaluar el modelo. Para este caso se obtienen los valores horarios de la potencia generada por el parque, la radiación solar (W/m²), la temperatura ambiente (^oC) y la velocidad del viento (m/s) desde enero de 2019 hasta junio de 2020.
Preprocesamiento de los datos: Una vez que se han adquirido los datos es importante revisar para completar con datos equivalentes los datos perdidos o eliminar los días en los cuales falta registro de los mismos debido a la falla en un sensor o a la salida por mantenimiento del sistema. Además, de acuerdo a la estructura del modelo que se adopta, en este paso se requiere la descomposición de cada señal usando la DWT, la selección de variables y la adecuación de vectores de entradas y objetivos para el entrenamiento de las redes neuronales.
Entrenamiento y desarrollo de los modelos de predicción: esta es la etapa central del proceso, en ella se ajusta o entrena el modelo, que fundamentalmente se trata del proceso de entrenamiento de las redes neuronales artificiales. En este paso se procede al diseño de diferentes redes y a la optimización de sus diferentes parámetros durante el entrenamiento buscando reducir al máximo el error en la predicción y así seleccionar la variante con mejor desempeño.
Evaluación del modelo de predicción: A la hora de elegir, desarrollar o comparar modelos de predicción es preciso que estos sean evaluados. Para ello se utilizan una serie de criterios que permiten calcular la adecuación de las predicciones a la realidad. Por supuesto que esta evaluación se realiza con una serie de datos históricos diferentes a los utilizados en el desarrollo del modelo. Por ello la serie de datos históricos a la que se hace referencia en el primer paso debe dividirse en dos conjuntos diferenciados, uno para desarrollar o entrenar el modelo y otro para evaluarlo. De esta forma se selecciona el modelo con los menores errores de predicción.

Una vez finalizado el proceso de desarrollo, el modelo puede ser aplicado para obtener las predicciones deseadas.

Siguiendo la línea de ^{Tesfaye, et al. (2018}), la estrategia seguida en la modelación fue la de desarrollar un modelo híbrido con DWT pero utilizando redes neuronales artificiales. Una diferencia sustancial es que la estrategia de modelación se basó únicamente en valores pasados reales, mientras Tesfaye, et al. (2018), emplean históricos de predicciones de variables meteorológicas. Es decir, en esta investigación se utilizaron solamente datos históricos de mediciones locales tanto de producción como de variables meteorológicas, lo que sirve de punto de partida para incorporar en el futuro predicciones de NWP y mejorar la precisión. La estructura de la estrategia de pronóstico se resume en la figura 1.

Como se muestra en la figura 1, la transformada wavelet es empleada al inicio y al final con propósitos de descomposición y reconstrucción, respectivamente. Las series de potencia y de las variables meteorológicas se descomponen independientemente en una señal de aproximación (A3) y las señales correspondientes a los coeficientes de detalle (D1, D2 y D3) empleando la wavelet db4 con tres niveles. Para el caso específico de la componente de alta frecuencia D1 el pronóstico se basa en el valor medio para el instante t considerando las seis semanas previas. Con estos componentes se forman subseries, que se utilizan en combinación con información de las series originales, como entradas de redes neuronales previamente entrenadas a fin de tener el pronóstico de las subseries de potencia. Finalmente, las señales de subseries de potencia futura, son recombinadas para conformar el pronóstico de la potencia del parque fotovoltaico.

Fig. 1 - Estructura general de la estrategia de pronóstico de la generación del parque fotovoltaico.

En el proceso de desarrollo del modelo se diseñaron y entrenaron varias redes neuronales para utilizarlas como predictores de las componentes A3, D3 y D2. Se consideraron varias redes de regresión generalizada (RG) y varias redes del tipo feedforward backpropagation (FFB), seleccionando finalmente las de menor error y mayor coeficiente de correlación entre la salida de la red y los valores de potencia medida utilizados como targets.

El paso más importante a la hora de seleccionar el modelo de predicción definitivo entre todos los desarrollados es el correspondiente a su evaluación. Para ello se parte de una serie de relaciones o criterios para analizar los resultados determinando su adecuación a la realidad.

En la literatura internacional se muestran diversos indicadores de evaluación. Los más habituales y que fueron utilizados en esta investigación son:

La diferencia entre el valor real y el valor de la predicción, es decir, el error de predicción que matemáticamente se expresa como:

Siendo:

	error de predicción para el instante t
	valor real (medido) de la potencia fotovoltaica generada en el instante t, en MW
	predicción de la potencia fotovoltaica generada para el instante t, en MW

Entre los indicadores estadísticos más usuales para evaluar el funcionamiento de un modelo de predicción está el porcentaje de error absoluto medio (MAPE) y la raíz del error medio cuadrático (RMSE). El indicador MAPE se calcula según la ecuación (3) como:

Donde:

N:	es el número de observaciones, 24 - para el caso de predicción de la potencia horaria de un día.
	es la potencia promedio del día, en MW

El indicador RMSE se calcula por la ecuación (4)

La suma de los cuadrados del error (SSE) es otro de los indicadores más utilizados y se calcula por la ecuación (5):

También es común evaluar el modelo por la desviación estándar del error que se calcula como:

La variabilidad de un modelo de pronóstico, después de ajustado, también es una medida de la incertidumbre del modelo y se puede medir calculando la varianza del error. A medida que la varianza es más pequeña, el pronóstico es más preciso (^{Tesfaye, et al., 2018}). De igual manera, el error calculado es una indicación de la precisión del modelo por lo que entre mayor sea el error. mayor incertidumbre. La varianza del error se calcula por la ecuación (7) como:

Siendo:

El método de pronóstico híbrido propuesto, usando la DWT y dos tipos de redes neuronales como predictores de los componentes A3, D3 y D2 se emplea para predecir la generación diaria del parque durante la semana del 5 al 11 de enero de 2020 a modo de ejemplo. El modelo fue desarrollado en ambiente Matlab y a continuación, se muestra una imagen de la Command Window del Matlab mostrando los resultados del modelo para el día 5 de enero de 2020 (figura 2). Se puede apreciar que los estadísticos que miden el error son menores para el caso de utilizar el modelo híbrido con relación al modelo persistente, excepto el MAPE que es menor para el caso del modelo persistente, pero hay que tener presente que este es un valor medio del error.

Fig. 2 - Muestra de la Command Window de Matlab con resultados del modelo de pronóstico para el 5 de enero de 2020.

Otra salida en forma gráfica del modelo es la curva de generación para el día siguiente. En la figura 3 se muestran las curvas de la potencia horaria para el 5 de enero de 2020, pronosticada con el modelo propuesto usando redes FFB y RG en color azul y rojo respectivamente, superpuesta a la curva de generación real que se produjo ese día en color negro. También y solo a modo de comparación se presenta el resultado para el modelo persistente en color verde. Los resultados del modelo para toda la semana del 5 al 11 de enero se muestran en la tabla 1.

Fig. 3 - Curvas de generación pronosticada y real para el 5 de enero de 2020.

Tabla 1 - Indicadores de errores diarios del modelo propuesto y del modelo persistente.

Fecha	Modelo	MAPE (%)	SSE (MW²)	RMSE (MW)	SDE (MW)	σ²
5/1/2020	TW_FFB	39.889	11.3	0.68618	0.65759	0.47781
TW_RG	39.31	10.258	0.65376	0.62652	0.39835
Persistente	31.465	13.077	0.73816	0.70741	0.54598
6/1/2020	TW_FFB	26.954	4.5957	0.43759	0.41936	0.18819
TW_RG	33.13	6.709	0.52872	0.50669	0.28292
Persistente	35.911	15.415	0.80144	0.76804	0.61727
7/1/2020	TW_FFB	28.234	8.4231	0.59242	0.56774	0.37532
TW_RG	35.517	9.1153	0.61628	0.5906	0.41928
Persistente	23.967	11.111	0.6804	0.65205	0.47128
8/1/2020	TW_FFB	30.675	5.8406	0.49331	0.47276	0.21847
TW_RG	32.868	6.5191	0.52118	0.49947	0.2508
Persistente	37.544	18.448	0.87674	0.84021	0.74822
9/1/2020	TW_FFB	31.095	5.4865	0.47813	0.45821	0.2216
TW_RG	23.238	3.3679	0.3746	0.35899	0.1383
Persistente	35.447	10.387	0.65787	0.63045	0.3629
10/1/2020	TW_FFB	42.121	12.427	0.71957	0.68959	0.5169
TW_RG	41.931	10.438	0.65947	0.63199	0.44349
Persistente	39.272	14.264	0.77093	0.7388	0.66696
11/1/2020	TW_FFB	26.892	5.9269	0.49694	0.47624	0.27528
TW_RG	30.829	6.2526	0.51042	0.48915	0.29323
Persistente	45.134	23.442	0.98831	0.94713	1.0879

En la tabla 1 se han señalado los menores valores de cada indicador. Se puede apreciar que para todos los días el modelo propuesto es superior al persistente y los resultados sugieren que TW_FFB podría ser superior, pero se requiere analizar una muestra mayor. De igual manera la varianza del error es menor en todos los casos para el modelo propuesto, indicando menor incertidumbre en el pronóstico.

Es común cuantificar la mejora en el error de predicción que presenta un modelo con respecto a otro, que se toma como referencia, realizando una comparación relativa entre alguno de los indicadores de error definidos anteriormente. De esta forma, se define la mejora mediante la ecuación (9).

Donde:

	mejora porcentual del indicador o criterio de error escogido en el modelo evaluado con respecto al mismo valor del indicador en el modelo de referencia.
	es el criterio de error del modelo de referencia
	es el criterio de error del modelo evaluado

El criterio de error escogido suele ser el RMSE (^{Muñoz, 2014}), por lo que la ecuación (10) se reescribe como:

Evaluando la ecuación (10) con los resultados mostrados en la tabla 1 se puede constatar que el modelo propuesto es mejor entre 6.66% y 49.71% que el modelo persistente.

A partir de los resultados anteriores se propone como una primera aproximación adoptar el modelo híbrido que combina DWT con redes feedforward backpropagation para el pronóstico de la generación fotovoltaica del parque. Los resultados para la semana utilizada como estudio de caso se muestran en la figura 4. Para estos siete días se tiene: MAPE=33.89 %, RMSE=1.5 MW, SSE=53.99 MW², SDE=0.52 MW y σ²=0.32.

Fig. 4 - Generación de potencia real y pronosticada para la semana del 5 al 11 de enero de 2020 en el parque estudiado.

Conclusiones

La bibliografía consultada muestra que el desarrollo de modelos de pronóstico de la generación fotovoltaica es un tema de investigación, desarrollo y despliegue intensivo en todo el mundo en los últimos años por las implicaciones técnicas y económicas que tiene en la operación de los sistemas de potencia. Estas investigaciones dejan patente que el uso de herramientas de inteligencia artificial ya sea para modelos de regresión o clasificación (redes neuronales, máquinas de soporte vectorial, redes profundas), permiten simular el comportamiento de la producción horaria del sistema solar fotovoltaico de una forma más precisa que las técnicas clásicas debido a que logran solventar las no linealidades que presentan estos sistemas.

Se desarrolló un modelo original basado en datos pasados, que combina redes neuronales con preprocesamiento de la información primaria y que requiere un mínimo de variables explicativas, información disponible en el sistema SCADA y variables meteorológicas medidas localmente en el parque fotovoltaico (producción, radiación solar y temperatura ambiente del día previo). El modelo cuenta además con una ventaja de aplicación práctica relevante: puede implementarse, como un primer paso, sin coste alguno, en sistemas informáticos de uso común, sin la utilización de predictores numéricos del clima, pudiendo ofrecer predicciones con un horizonte de tiempo de 24 horas para el uso del despacho de carga provincial. De acuerdo a la literatura consultada su precisión puede mejorarse reduciendo el horizonte de tiempo lo cual queda abierto a la investigación.

El modelo propuesto combina la descomposición de las series temporales mediante transformada wavelet discreta con redes neuronales artificiales para pronosticar las componentes de la potencia del día siguiente y posteriormente combinar estas componentes para tener el pronóstico definitivo. Se emplea la wavelet db4 con tres niveles para descomponer las series en componentes A3, D3, D2 y D1. Para el caso de la componente de alta frecuencia D1 el pronóstico se basa en el valor medio para el instante t considerando las seis semanas previas.

Se realizó un análisis para la selección de las redes neuronales a utilizar como predictores de las componentes A3, D3 y D2, diseñándose varias redes de regresión generalizada variando su spread y varias redes feedforward backpropagation variando el número de neuronas de la capa oculta. Se seleccionaron finalmente las de menor error y mayor coeficiente de correlación entre la salida de la red y los valores de potencia medida utilizados como objetivos. A partir de los resultados obtenidos se propone como una primera aproximación adoptar el modelo híbrido que combina transformada wavelet con redes feedforward backpropagation.

La validación del modelo se realizó con el conocimiento de la información real del parque para el año 2020. Específicamente se validó con la semana del 5 al 11 de enero de 2020. Los resultados obtenidos son prometedores, si bien, debido a las características propias de cada parque solar fotovoltaico, la comparación con otros modelos de la literatura internacional no puede realizarse con exactitud, se ha desarrollado un modelo que proporciona mejores resultados que el modelo trivial del día previo (independientemente del tipo de red neuronal que se emplee), siendo el porcentaje de mejora del 6.66% al 49.71% para el periodo de tiempo evaluado.

Son varias las líneas de investigación que se derivan de los resultados presentados en este trabajo y que constituyen una continuación natural del trabajo desarrollado hasta el momento. Las recomendaciones de mayor relevancia o interés, para trabajos futuros, con el fin de mejorar los resultados obtenidos con el modelo de predicción desarrollado, son las siguientes: Desarrollar modelos para horizontes de tiempo de una hora con el objetivo de incrementar la precisión del pronóstico, probar la eficacia de otras familias de wavelets en la DWT, incluir en el modelo nuevas variables como velocidad del viento, índice de claridad, día del año y hora, desagregar el modelo desarrollando predictores con la misma metodología seguida en esta investigación para cada inversor del parque de manera individual, con el objetivo de considerar con mayor exactitud la disponibilidad de los generadores instalados y emplear algoritmos evolutivos que permitan la selección óptima de las variables de entrada, del número de neuronas en capas ocultas, de valores de los parámetros del algoritmo de entrenamiento, todo ello con el objetivo de seleccionar la red neuronal idónea que logre un menor error de predicción.

Referencias bibliográficas

Agencia Internacional de Energía. (2019). World Energy Outlook 2019. https://www.iea.org/reports/world-energy-outlook-2019 [ Links ]

Amjady, N. Ã., & Keynia, F. (2009). Short-term load forecasting of power systems by combination of wavelet transform and neuro-evolutionary algorithm. Energy, 34, 46-57. [ Links ]

Amjady, N., & Keynia, F. (2008). Electrical Power and Energy Systems Day ahead price forecasting of electricity markets by a mixed data model and hybrid forecast method. International Journal of Electrical Power and Energy Systems, 30(9), 533-546. [ Links ]

Amjady, N., & Keynia, F. (2011). A New Neural Network Approach to Short Term Load Forecasting of Electrical Power Systems. Energies, 4, 488-503. [ Links ]

Borrajero, I., Baró, A., Peláez, J. C., & Fernández, M. H. (2016). Pronóstico de la radiación solar y potencia a generar en las plantas fotovoltaicas conectadas a la red eléctrica nacional. Informe de resultado: Uso del WRF-Solar y el post-procesamiento MOS para el pronóstico de la radiación solar. Instituto de Meteorología. [ Links ]

Gómez, J. R., Di Santo, K. G., & Saidel, M. A. (2016). Linear and non-linear methods for prediction of peak load at University of São Paulo. Measurement, 78, 187-201. [ Links ]

González, J. A., Waczowicz, S., Reischl, M., Mikut, R., & Hagenmeyer, V. (2016). Photovoltaic power forecasting using simple data-driven models without weather data. Computer Science - Research and Development, 32. [ Links ]

International Renewable Energy Agency. (2013). Smart grids and renewables a guide for effective deployment. IRENA. https://www.irena.org/-/media/Files/IRENA/Agency/Publication/2013/smart_grids.pdf?la=en&hash=08F3E571B5580F017E70BCD1EC39864536681ADB [ Links ]

Li, Y., He, Y., Su, Y., & Shu, L. (2016). Forecasting the daily power output of a grid-connected photovoltaic system based on multivariate adaptive regression splines. Applied Energy , 180, 392-401. [ Links ]

Muñoz, A. (2014). Modelos de predicción a corto plazo de la generación eléctrica en instalaciones fotovoltaicas. (Tesis doctoral). Universidad de La Rioja. [ Links ]

Peña, J. A., Viego, P. R., Gómez, J. R., & Padrén, E. A. (2019). Pronóstico del consumo pico para la gestión del energética de la Universidad de Cienfuegos. Revista Universidad y Sociedad, 11(4), 220-228. [ Links ]

Pierro, M., Bucci, F., Felice, M. De, Maggioni, E., Moser, D., Perotto, A., Spada, F., & Cornaro, C. (2016). Multi-Model Ensemble for day ahead prediction of photovoltaic power generation. Solar Energy , 134, 132-146. [ Links ]

Ramsami, P., & Oree, V. (2015). A hybrid method for forecasting the energy output of photovoltaic systems. Energy Conversion and Management, 95, 406-413. [ Links ]

Rocha, A. J., & Alves, A. P. (2005). Feature Extraction via Multiresolution Analysis for Short-Term Load Forecasting. IEEE Transactions on Power Systems, 20(1), 189-198. [ Links ]

Sajjad, K., Khavaninzadeh, M., & Keynia, F. (2013). Applying Wavelet to ANN based short-term load forecasting: A case study of Zanjan power pystem. International Journal of Electrical and Electronics Engineering Research, 3(2), 209-216. [ Links ]

Sudheer, G., & Suseelatha, A. (2014). A wavelet-nearest neighbor model for short-term load forecasting. Energy Science & Engineering, 3(1), 1-9. [ Links ]

Tesfaye, A., Zhang, J., & Zheng, D. (2018). Short-term photovoltaic solar power forecasting using a hybrid Wavelet-PSO-SVM model based on SCADA and Meteorological information. Renewable Energy , 118, 357-367. [ Links ]

Yang, X., Xu, M., Xu, S., & Han, X. (2017). Day-ahead forecasting of photovoltaic output power with similar cloud space fusion based on incomplete historical data mining. Applied Energy , 206, 683-696. [ Links ]

Recibido: 15 de Septiembre de 2020; Aprobado: 08 de Noviembre de 2020

^*Autor para correspondencia. E-mail: magomez@ucf.edu.cu

Los autores declaran no tener conflicto de intereses.

Los autores han participado en la redacción del trabajo y análisis de los documentos.