INTRODUCCIÓN
En los sistemas industriales actuales hay una marcada necesidad de mejorar la eficiencia de los procesos para lograr aumentar la producción y lograr productos de mayor calidad que satisfagan los estándares nacionales e internacionales a la vez que se satisfacen las regulaciones medioambientales y de la seguridad industrial. Los fallos en las industrias producen un impacto no favorable para satisfacer esos objetivos. Lo anterior indica la necesidad de desarrollar sistemas de diagnóstico de fallos también conocidos como sistemas de monitoreo de condición en los procesos industriales que logren detectar y localizar los fallos que se presenten en el menor tiempo posible y con un elevado desempeño. Para lograr esto, los sistemas de diagnóstico que se desarrollen deben resolver los inconvenientes que provocan el ruido en las mediciones, la pérdida de información producto de errores en los sistemas de trasmisión de la información, la complejidad computacional que surge en las grandes industrias cuando el número de variables que se miden en cada instante de muestreo es muy grande, identificar nuevos patrones que pudieran ser representativos de fallos no conocidos y detectar fallos en los procesos de transición en los sistemas con múltiples modos de operación entre otras dificultades. Además de lo anterior, es necesario que las soluciones desarrolladas sean generalizables a la gran diversidad existente entre los procesos industriales donde se distinguen procesos químicos, sistemas eléctricos, mecánicos y electromecánicos, sistemas de distribución de agua, y sistemas de manufactura que se caracterizan por su amplia presencia en el moderno mundo industrial.
En este trabajo se presentan un grupo de nuevos paradigmas dentro del diagnóstico de fallos en sistemas industriales que pretenden dar solución a varias de las problemáticas anteriores utilizando de manera efectiva técnicas de agrupamiento (clustering), de manejo de datos (data driven), imputación, y herramientas computacionales provenientes del amplio mundo de lo que se conoce hoy como inteligencia computacional. Específicamente se presentan nuevas propuestas de agrupamiento y clasificación de observaciones, así como el desarrollo de algoritmos híbridos que permiten mejorar significativamente el desempeño de los sistemas de diagnóstico, identificar en línea nuevos patrones que pueden representar nuevo fallos, nuevos procedimientos de imputación de datos faltantes en las observaciones obtenidas por los sistemas SCADAS que favorecen mantener elevados niveles de despeño en los sistemas diagnóstico y nuevos indicadores para medir de manera más efectiva el desempeño de los clasificadores. Además, se presentan procedimientos de agrupamiento de nodos en las redes de distribución de agua para crear áreas que faciliten la detección y localización de fugas agua, de división de grandes procesos en subprocesos a los que se pueden aplicar distintas herramientas buscando las de mejores resultados en cada subproceso y se proponen nuevas soluciones para la detección de fallos en la fase de transición en los sistemas con múltiples modos de operación. Las propuestas que en esos resultados se presentan son aplicadas a problemas de pruebas establecidos en la literatura científica internacional y que se insertan en tres grandes grupos: procesos químicos, sistemas electromecánicos y redes urbanas de distribución de agua los cuales son muy importantes para nuestro país en sus perspectivas de desarrollo, ahorro y cuidado del medio ambiente.
MÉTODOS
Agrupamiento, estrategias híbridas y métodos Kernel
El ruido en los sistemas industriales es uno de los factores que más afecta para lograr buenos desempeños en los sistemas de diagnóstico de fallos. Otro elemento a tener en cuenta es el solapamiento entre los patrones que representan el funcionamiento normal del proceso y los que caracterizan al proceso ante la presencia de diferentes fallos en sensores, actuadores y en el propio proceso. Para resolver estas dificultades se proponen metodologías que combinan diferentes algoritmos y métodos Kernel para mejorar el desempeño de los sistemas de diagnóstico.
En una primera propuesta se utiliza la idea con la que se desarrolló el algoritmo noise clustering (NC) que logra agrupar las observaciones que son clasificadas como ruido y se modificó el algoritmo fuzzy c-means. De esta manera se logra crear con las observaciones del proceso c+1 clases donde las c clases representan al estado funcionamiento normal y los estados que representan a los diferentes fallos que se desean diagnosticar en el proceso. La clase restante es la que contiene las observaciones clasificadas como observaciones fuera de rango. Un algoritmo alternativo en el primer paso de la metodología es el uso del algoritmo density oriented fuzzy C-means (DOFCM) que tiene como objetivo disminuir la sensibilidad al ruido en el proceso de agrupamiento difuso y al igual que el algoritmo NC crea c+1 clases siendo una la del ruido. Posteriormente, en un segundo paso, los datos agrupados en las c-clases es procesado por el algoritmo Kernel fuzzy C-means que al proyectar los datos a un espacio de dimensión superior logra mejoras significativas en el proceso de clasificación. En un tercer paso se puede optimizar los parámetros de los algoritmos anteriormente mencionados utilizando metaheurísticas que permitirán mejorar los resultados anteriores. 1,2,3,4,5
En la figura 1 se presenta esta propuesta de metodología. En la figura 2 se presenta gráficamente el procesamiento que se hace de los datos en esta propuesta.
En la propuesta anterior las observaciones que son clasificadas como ruido son desechadas y sin embargo esas observaciones pueden ser representativas de un nuevo fallo para el cual el clasificador no estaba entrenado. Es por esta razón que en una segunda propuesta las observaciones agrupadas en la clase que representa al ruido son procesadas por un algoritmo que analiza la densidad del grupo para determinar si esa clase es representativa de un nuevo patrón lo cual es indicado por un valor elevado de esa densidad. En ese caso los expertos deben identificar el nuevo fallo que es representado por ese patrón e incorporar ese patrón a la base de datos del proceso que contiene el patrón que representa el estado de funcionamiento normal y el patrón que representa a cada fallo. 6,7,8
Una tercera propuesta, pero dirigida en esta ocasión a disminuir la complejidad computacional y utilizar las ventajas de combinar herramientas de clasificación es la estrategia de agrupamiento que se proponen O. Llanes Santiago et al..9 donde se logran elevados niveles de desempeños a partir de dividir el proceso en subprocesos para el análisis.
Una última propuesta que se realiza en esta investigación es la extensión de las técnicas de agrupamiento a las redes de distribución de agua. Ahora el agrupamiento no se realiza a partir de observaciones pertenecientes a un patrón de comportamiento sino a nodos de la red que de acuerdo a su distribución topológica forman una zona. En este caso, el método de agrupamiento permite formar zonas de análisis que ayudan a simplificar la labor de detección y localización de la fuga significativamente tal y como se muestra en. 10,11
Monitoreo de condición basado en modelo
Cuando los procesos no son de elevada complejidad se pueden desarrollar modelos matemáticos que representan el funcionamiento de los mismos. En una primera propuesta se desarrollan modelos donde los fallos son representados por parámetros del mismo. Cuando la salida del proceso y el modelo difieran para un mismo valor de la entrada eso indica la presencia de un fallo. Entonces mediante un proceso de optimización en el cual se utilizan algoritmos de inteligencia computacional se van estimando esos parámetros que representan los diferentes fallos y estableciéndose restricciones para la toma de valores de acuerdo a la realidad física. Cuando se logra que la salida del proceso y el modelo coincidan, los valores de los parámetros estimados indican dónde está el fallo y cuál es su magnitud. La propuesta fue aplicada a procesos químicos y sistemas eléctricos y electromecánicos. Esta misma estrategia de estimación de parámetros fue usada para la estimación de parámetros cinéticos en modelos de cromatografía.
Para el caso de la aplicación de esta metodología en las redes de distribución de agua donde se aplicó una variante de algoritmo de evolución diferencial en la localización de la fuga que considera la configuración topológica de la red en la modificación del espacio de búsqueda. 12,13,14,15,16
Con el objetivo de mejorar los resultados anteriores en la localización de fugas de redes de distribución de agua, se creó una metodología donde en un primer paso se utilizó una red neuronal de aprendizaje profundo para detectar la presencia de una fuga. Una vez que la fuga es detectada con un proceso de regresión utilizando un proceso gaussiano el rango de dimensión de la fuga es estimado lo cual ayuda al algoritmo de evolución diferencial modificado mencionado anteriormente en el proceso de localización al cual se le incorporó también un análisis temporal todo lo cual redundó en la mejora significativa de la detección y localización de las fugas. La figura 3 muestra esta propuesta de metodología. 17
Finalmente, fue aplicada una estrategia basada en el modelo para detectar fallos múltiples en redes de manufactura y fallos de dispositivos en redes inteligentes, pero en este caso se emplearon con éxito las redes booleanas probabilísticas.18,19
Diagnóstico de fallos con herramientas de manejo de datos, imputación y para sistemas multimodos
Cuando los procesos son de elevada complejidad y la construcción de un modelo basado en los primeros principios se dificulta, los sistemas de diagnóstico se desarrollan con herramientas que permiten el análisis de los datos obtenidos por los sistemas de control y adquisición de datos (SCADA). Las propuestas expresadas en la subsección “Agrupamiento, estrategias híbridas y métodos Kernel” pueden ser ubicadas también en este grupo, pero se decidió tratarlas aparte por el tipo de herramientas utilizadas basadas fundamentalmente en el agrupamiento.
Un problema muy común en los sistemas de SCADA es la pérdida de información de una o varias variables en una observación por ruido o problemas en el canal de transmisión de la información. Esta pérdida de información afecta seriamente la clasificación de la observación dentro de alguno de los estados conocidos del proceso. Para resolver esta dificultad, O. Llanes Santiago et al.. (20 proponen una metodología donde se realiza la imputación en línea para estimar los datos perdidos, utilizando herramientas de manejo de datos. A partir de realizada la imputación la clasificación de la observación es realizada demostrándose que se alcanzan elevados resultados de desempeño en el sistema de diagnóstico. La figura 4 presenta en un diagrama de flujo esta propuesta de metodología.
Los sistemas multimodo son aquellos que se caracterizan por tener varios modos de operación y procesos de transición entre los mismos. La mayor parte de las estrategias de diagnóstico de fallos presentes en la literatura científica están desarrolladas para ser aplicadas cuando el proceso esté en un modo de trabajo y no tienen un buen comportamiento cuando son aplicadas en los procesos de transición entre modos donde la mayoría de las variables están cambiando su valor en el tiempo. En esta investigación se realizan varias propuestas para el diagnóstico de fallos en los procesos de transición donde se tiene en cuenta la dinámica de las variables en la transición. 21,22,23
Los niveles de automatización alcanzados por las redes de distribución de agua hacen factible la aplicación de estrategias basadas en manejo de datos para la detección y localización de fugas en redes de distribución de agua. En esta investigación se desarrolla un modelo de demanda en redes de distribución de agua que permite el uso de herramientas de manejo de datos para la detección de fugas con elevados desempeños y se analiza el comportamiento de varias herramientas de manejo de datos que permite encontrar aquellas que mejor desempeño tienen para este tipo de procesos. 24,25,26
Evaluar la robustez de las herramientas de clasificación ante el ruido es un elemento muy importante a tener en cuenta para la selección de una herramienta de clasificación. En esta investigación se realiza una propuesta de índice que evalúa la robustez frente al ruido de diferentes herramientas de clasificación. 27
RESULTADOS Y DISCUSIÓN
Las propuestas de metodologías presentadas en la sección anterior se aplicaron a problemas de pruebas reconocidos en la literatura científica que son representativos de procesos reales. Ejemplos según el Tennessee Eastman process, el tanque reactor continuamente agitado (SCRT) el sistema electromecánico DAMADICS representativo de una electroválvula y la red de distribución de agua Modena de la ciudad italiana del mismo nombre que está considerada una red compleja dada su dimensión.
Se escogieron esos procesos por ser representativos de los tipos de procesos con mayor presencia en Cuba en temas vitales como lo es la industria química, la industria mecánica y las redes urbanas de distribución de agua.
En todos los casos los resultados obtenidos fueron comparados con otras propuestas publicadas en la literatura científica internacional demostrándose la obtención de mejores resultados en el desempeño de los sistemas de diagnóstico de fallos con las metodologías propuestas.
Es necesario destacar en este análisis de los resultados es que la aplicabilidad en Cuba de estas propuestas de sistemas de diagnóstico de fallos se puede lograr si las industrias tienen instalado un sistema SCADA que recolecta los valores de las principales variables. Es decir, no se necesitan inversiones nuevas para su aplicación inicial.
Los beneficios de la aplicación de estos sistemas en el país son directamente apreciables en las redes de distribución de agua para la detección y localización de fugas que hacen que se pierdan grandes cantidades de este vital líquido de manera sistemática en muchas de nuestras ciudades. En el caso de otras industrias como es el caso de las industrias del sector químico, farmacéutico del sector de refinación y del sector de producción de energía se reflejará en la disminución de los tiempo de parada, en sustituir el mantenimiento preventivo y correctivo por un mantenimiento predictivo en el momento que se necesite lo que disminuirá los costes de la actividad de mantenimiento, en la calidad de los productos finales de cada industria y en la seguridad de las industrias y el personal que labora en las mismas.
Conclusiones
En este trabajo se han presentado un grupo de nuevos paradigmas para mejorar el desempeño de sistemas de diagnóstico de fallos o monitoreo de condición en sistemas industriales. Las propuestas intentan dar solución a algunos problemas que afectan los sistemas de diagnóstico de fallos como son: ruido en las mediciones, pérdida de información en los canales de comunicación, nuevos patrones representativos de nuevos fallos, la detección de fallos en los procesos de transición en los sistemas multimodos entre otros, como evaluar la robustez de los diferentes tipos de clasificadores entre otros.
Para resolver lo anterior son utilizadas de manera efectiva técnicas de agrupamiento, de manejo de datos, imputación y herramientas computacionales provenientes del amplio mundo de lo que se conoce hoy como inteligencia computacional. Las propuestas son validadas en casos de estudio que representan sistemas de diferente naturaleza todos ellos representativos de áreas muy importantes en las perspectivas del país para su desarrollo, uso eficaz y eficiente de los recursos, ahorro, seguridad industrial y cuidado del medio ambiente. La factibilidad de transferencia tecnológica a la industria es inmediata.