SciELO - Scientific Electronic Library Online

 
vol.20 issue3Simulation of biomass pneumatic drying with ascending swirling movementDesign of the Dupont availability Method to support decision making in maintenance author indexsubject indexarticles search
Home Pagealphabetic serial listing  

My SciELO

Services on Demand

Journal

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


Ingeniería Mecánica

On-line version ISSN 1815-5944

Ingeniería Mecánica vol.20 no.3 La Habana Sept.-Dec. 2017

 

Artículo Original

 

Redes neuronales regularizadas aplicadas a la estimación de propiedades mecánicas de perfiles de acero

 

Regularized neural networks applied to the estimation of the mechanical properties of steel profiles

 

 

Doniel Jiménez-Sánchez, José Arzola-Ruiz

Universidad Tecnológica de La Habana José A. Echeverría, Centro de Estudios de Matemática. La Habana, Cuba.

 

 


RESUMEN

El uso de las redes neuronales artificiales de base radial para la estimación de las propiedades mecánicas de las hornadas a partir de su composición química y superficie transversal del perfil terminado,facilita el proceso de generación de opciones de destino de hornadas de perfiles ligeros de acero destinados a la construcción. En el trabajo realizadoesta estimación se hizopor redes de base radial entrenadas con el método iterativo de regularización de Landweber, a partir de los datos acumulados de ensayos mecánicos en los talleresadoptados como Estudio de Caso, los que producen fundamentalmente barras corrugadas de acero para su uso en la construcción. La utilización de redes regularizadas permite disminuir los errores de generalización en la estimación de las propiedades mecánicas, mejorando así la calidad de las opciones de destino de las hornadas producidas. 

Palabras claves: redes neuronales artificiales de base radial, estrategias de regularización, dirección operativa de la producción.


ABSTRACT

The use of the radial baseartificial neural networks for the estimation of the mechanical properties of the heats starting from its chemical composition and traverse surface of the finished profile facilitates the options generation process forthe heats destination while producingsteel slight profiles dedicated to the constructions. In the present work this estimation is made by radial base artificial neural networks, trained by the Landweber regularization iterative method, starting from the available mechanical properties data obtained from the quality control of the workshops adopted as Study Case. The use of regularized networks allows diminishing the generalized errors in the mechanical properties estimation, improving this way the quality of the options of destination of the heats produced.

Key words: basis neural networks, regularization strategies,operative production management.


 

 

INTRODUCCIÓN

En las empresas siderúrgicas, el aseguramiento de las propiedades normadas de la producción terminada y entregada a los clientes comprende no solo la asignación adecuada de semiproductos para la fabricación de productos terminados, sino también la conducción racional de los procesos productivos [1, 2].

La planificación de las entregas de la producción terminada se realiza por pedidos, lo que presupone la producción de acuerdo a la llegada misma de cada pedido, o por inventarios, lo que implica producir para acumular inventarios y entregar de acuerdo a la disponibilidad del pedido. Una combinación de ambos es la opción indicada para minimizar costos totales [3-5].

En [6] se propone un esquema para el procesamiento de los pedidos de los clientes para su conversión en órdenes de producción, combinando planificación de las entregaspor pedidos y por inventarios. A partir de estas órdenes de producción se elaboran las secuencias de los talleres de laminación. En caso particular de los perfiles para la construcción, cada orden necesariamente incluye el diámetro del perfil, la longitud de las barras y norma de calidad a satisfacer. Las mejores opciones de destino de hornadas de materiales son aquellas en las que se minimiza el exceso de propiedades mecánicas, asegurando los valores requeridos de éstas para el cumplimiento de la designación de servicio [7]. El problema de cuales hornadas han de ser utilizadas en determinados destinos del conjunto de hornadas en proceso, constituye un problema de selección óptima de materiales [8]. Los modelos matemáticos usados para la generación o selecciónde opciones hace necesaria la estimación de las propiedades mecánicas de las hornadas a partir de su composición química y sección transversal del producto fabricado con la máxima precisión posible, para las condiciones de un taller de laminación de perfiles terminados dado, el que se caracteriza de regímenes de deformación y de calentamiento dados. La estimación precisa de las propiedades mecánicas de los aceros para la construcción constituye una tarea muy actual, dada la necesidad de definir su destino, es decir, taller, perfil y grado que resulta más racional para la empresa productora, asegurando los indicadores de calidad requeridos por los clientes [8].

Este trabajo se realizó a partir de los datos de dos talleres de laminación de una empresa siderúrgica, los que producen fundamentalmente barras corrugadas de acero para la construcción, a partir de palanquillas de sección cuadrada coladas en una instalación de vaciado continuo. Las propiedades principales de dichas barras son el límite de fluencia y el límite de rotura. En investigaciones anteriores se trató de estimar estas propiedades para los diferentes talleres de laminación por modelos de regresión lineales y cuadráticos [8]. El uso de estos modelos tiene el inconveniente de que producen excesivos errores estándar en los resultados calculados, con respecto a las mediciones, de alrededor del orden del 8 % – 10 % de su valor medio, lo que resulta excesivo para la adecuada determinación de un destino razonable. Por la razón anterior en este trabajo se aplican las redes neuronales de base radial entrenadas con el método de regularización de Landweber, conocidas como redes neuronales de base radial regularizadas, para estimar las propiedades mecánicas de los perfiles ligeros de acero.Con el uso de estas redes se logra disminuir el error de generalización producido en el ajuste, con respecto a los modelos obtenidos en trabajos anteriores, lo que hace posible la elección de un mejor destino para las hornadas de acero.

 

MÉTODOS Y MATERIALES

Redes neuronales artificiales de base radial

La ecuación de salida para la red neuronal con d neuronas de base radial y f neuronas de salida es la siguiente ecuación 1:

(1)

Donde:

Wsq - peso que facilita la conexión entre la neurona oculta q y la de salida s.

rq - distancia (generalmente la euclídea) que separa al vector de entrada (vector del espacio d-dimensional) del centro del nodo gaussiano q.

σq - ancho del nodo gaussiano q.   

λs - umbral del nodo de salida s.

Aprendizaje de las redes neuronales de base radial

El aprendizaje de las redes neuronales artificiales de base radial generalmente es de tipo híbrido, realizándose en dos etapas [9]. Primeramente, se lleva a cabo un entrenamiento no supervisado en la capa oculta, o sea, se determina la respuesta de las funciones de base radial ante el conjunto de datos de entrada (φ(r) en la ecuación 1. Posteriormente se realiza un entrenamiento supervisado en la capa de salida: Con la respuesta de las neuronas de la capa oculta se determinan los pesos y bias de la capa de salida, de manera que la salida sea la deseada en los datos de entrenamiento [10-12].

Sea K:d+1 h un operador lineal determinado por la matriz que representa la respuesta de las funciones de base radial ante un conjunto  de vectores de entrada; el proceso de búsqueda de los pesos y bias de la capa de salida se puede formular de la siguiente manera: Hallar la matriz real w, de orden (d+1)×f, como la solución de la ecuación lineal. Ver ecuación 2

(2)

Esta ecuación puede resolverse por el método de mínimos cuadrados. De esta forma las redes neuronales de base radial dejan un error de casi cero en los datos de entrenamiento, pero muchas veces un error grande en la validación o generalización [12].

Un análisis de la ecuación 2 permite concluir que la búsqueda de los pesos y bias de la capa de salida, o sea, la fase supervisada del entrenamiento de la red neuronal de base radial, puede interpretarse como la solución de un problema inverso, lo que permite que se puedan aplicar técnicas de regularización para su solución [13-15].

El método iterativo de Landweber

El método de Landweber es una estrategia de regularización de problemas inversos. Se utiliza para dar una solución aproximada de la ecuación 2, cuando las mediciones del miembro de la derecha están contaminadas con ruido [16-17].

La solución aproximada de la ecuación 2, wδ,donde el supraíndice δ indica que la solución es obtenida con los datos ruidosos, se computa por el proceso iterativo, ecuación 3.

(3)

para algún α tal que denota el operador conjugado del operador K.

Ahora, sea K: X→ Yun operador lineal, compacto e inyectivo con subespacio imagen denso; sea u ∈ , u > 1 y Rδ ∈ Y de manera que ‖R-Rδ‖ < δ y ‖Rδ‖ ≥ uδ; las siguientes afirmaciones son válidas:

a) ,∀δ >0; o sea, se puede realizar el proceso iterativo 3 hasta encontrar el más pequeño entero t = t(δ) con el cual se garantiza que ‖Kwt,δ -Rδ‖ ≤ uδ. Esta constituye la regla de parada de dicho algoritmo.

b) , si w = K’f se encuentra en el subespacio imagen del operador K, para algún e > 0 y para algún f con ‖f‖ ≤ E. Esta constituye una aproximación del error máximo cometido al computar la solución por el proceso iterativo de la ecuación 3.

Modelo matemático de la generación de opciones de destino de hornadas metalúrgicas

Los modelos matemáticos usados para la generación de opciones hacen necesaria la estimación de las propiedades mecánicas de las hornadas a partir de su composición química y sección transversal del producto fabricado con la máxima precisión posible, para las condiciones de un taller de laminación de perfiles terminados dado, el que se caracteriza de regímenes de deformación y de calentamiento dados. El problema general de la generación de opciones de destino de semiproductos del acero se puede modelar de la siguiente manera: se requiere definir un compromiso entre la minimización del exceso de las propiedades normadas Re y Rm (límite de fluencia y límite de rotura, respectivamente) de las m hornadas entregadas, y el riesgo asumido (probabilidad de rechazo de la hornada una vez laminada, por el sistema de aceptación – rechazo).Formalmente, ecuación 4:

(4)

Sujeto a:

(5)

(6)

(7)

Donde:

h– probabilidad que la hornada cumpla con las propiedades normadas una vez laminada.

Ah(Rej): Valor de la propiedad Re para el destino j, asegurado con una probabilidad igual o mayor a h y determinado según la composición química de la hornada y sección transversal del producto terminado.

: Valor normado de la propiedad Re para el destino j, en kgf/mm2.

Ah (Rmj): Valor de la propiedad Rm para el destino j, asegurado con una probabilidad igual o mayor a hy determinado según la composición química de la hornada y sección transversal del producto terminado.

: Valor normado de la propiedad Rm para el destino j en kgf/mm2.

θj: Variable que toma valor 1 si se adopta el destino j y valor 0 en caso que se adopte otro destino cualquiera.

La función objetivo (ecuación 4) persigue la selección de la opción con mínimo exceso de la propiedad Re o Rm, asegurada con una probabilidad mayor o igual ah. Las restricciones en la ecuación 5 y en la ecuación 6 obligan al cumplimiento del destino asignado con una probabilidad mayor o igual a h, para las dos propiedades y todos los destinos, de todas las hornadas que se van a asignar. La restricción en La ecuación 7, precisa que para cada hornada puede establecerse solo un destino.

Queda establecida entonces por el modelo la necesidad de estimar las propiedades mecánicas de las hornadas, a partir de su composición química y sección transversal del producto terminado.

Estimación de las propiedades mecánicas de las hornadas usando redes de base radial

En investigaciones anteriores [8] se trató de estimar las propiedades para los diferentes talleres de laminación de productos terminados de la empresa por modelos de regresión lineales y cuadráticos, pero el error absoluto es del orden 1,7 a 3,0 kgf/mm2; se hace indispensable entonces la utilización de otros métodos de estimación de las propiedades que conduzcan a la reducción del error de apreciación del modelo.

Del laboratorio de ensayos mecánicos de la empresa siderúrgica se seleccionaron al azar 5000 datos para la etapa de entrenamiento de la red y 2000 datos para la etapa de validación o generalización en el Taller 1; en el Taller 2 se seleccionaron 4000 datos para el entrenamiento y 2000 para la validación.

En la primera etapa de entrenamiento de cada red neuronal se tomaron 100 neuronas de la capa oculta, todas con funciones gaussianas, y luego se procedió al cálculo de los centros y de los anchos. Los centros se determinaron por el algoritmo de las k-medias, y los anchos como la media uniforme de las distancias del centro de cada neurona a los 10 centros más cercanos. Luego se aumentó la cantidad de neuronas de la capa oculta, añadiendo 10 neuronas en cada experimento, hasta que se obtuvo el mejor ajuste de los datos entre todas las pruebas realizadas. En la etapa de validación no se tuvieron resultados muy significativos, aunque sí se obtuvo un ajuste ligeramente superior con respecto a las ecuaciones de regresión descritas en [8], usando el mismo conjunto de datos. Entonces se decidió realizar la fase supervisada del entrenamiento de las redes con el método de regularización iterativo de Landweber, con un valor definitivo de α = 0,032, a partir del conocimiento de que las mediciones tenían un ruido de ± 0,35 kgf/mm2.

 

RESULTADOS

Con el procedimiento descrito anteriormente se obtuvieron dos redes neuronales de base radial, una para cada taller, que estiman las propiedades límite de fluencia y límite de rotura de los perfiles ligeros de acero producidos en cada uno, a partir de las concentraciones de Si, P, S, Cr, Ni y Cu, y al perfil de las barras. En la figura 1 se muestran los errores de validación en el ajuste de las propiedades mecánicas usando la red neuronal, en el Taller 1.

Como se puede apreciar los errores en la etapa de generalización no son elevados, y están dentro de un intervalo aceptable para la estimación de dichas propiedades mecánicas de las hornadas. En la figura 2 se muestran los errores obtenidos al estimar las propiedades de las hornadas en el Taller 2.

Es válido destacar que los errores de generalización en la estimación de las propiedades en el Taller 2 no son muy groseros y también se consideran dentro de un intervalo aceptable. Esto es un resultado satisfactorio, pues constituye una prueba de que las redes neuronales entrenadas con regularización son útiles para estimar las propiedades mecánicas de las hornadas producidas en cada taller.

 

DISCUSIÓN

En la tabla 1 se muestra la comparación entre algunos indicadores de la estimación realizada en el Taller1con ambas redes neuronales: la red  neuronal sin regularizar y regularizada. Se evidencia la considerable reducción de las neuronas de base radial en la capa oculta de la red de base radial regularizada, lo que favorece el proceso de cómputo de las propiedades.

No cabe dudas de que el ajuste realizado con las redes de base radial regularizadas es mejor con respecto al realizado usando las redes no regularizadas. Un análisis del coeficiente de determinación R2 para la red regularizada permite concluir que en cada propiedad estimada, más del 90 % de las variaciones en los datos es explicada por el modelo obtenido; asimismo los errores cuadráticos medios son pequeños.

En la tabla 2 se muestran los mismos indicadores del ajuste, pero en el Taller2. Nuevamente se evidencia una reducción de la cantidad de neuronas de base radial en las redes regularizadas, con respecto a las no regularizadas.

El ajuste realizado en el Taller 2 con las redes de base radial regularizadas, es superior al realizado con las redes no regularizadas. El coeficiente de determinación evidencia una elevada explicación de los datos por el modelo y una fuerte correlación lineal entre los datos experimentales y los estimados por la red; además, el error cuadrático medio es pequeño.

Las cifras reflejadas en las tablas 1 y 2 confirman la alta bondad del ajuste realizado con las redes de base radial regularizadas y su utilidad en la estimación de las propiedades límite de fluencia y límite de rotura en cada taller.

En [8] se estimaron las propiedades mecánicas de las hornadas producidas en el Taller 1 usando ecuaciones de regresión de tipo lineales y cuadráticas. En la tabla 3 se muestran los parámetros de la regresión hecha con dichos modelos y con las redes de base radial regularizadas.

En el Taller 2 también se estimaron las propiedades por modelos lineales y cuadráticos. La comparación realizada por ambos métodos se muestra en la tabla 4.

Un examen de los datos contenidos en las tablas 3 y 4 ilustra la superioridad de las redes neuronales de base radial entrenadas con regularización con respecto a los modelos estudiados de regresión, en la estimación de las propiedades mecánicas de los perfiles ligeros de aceros. El uso de las redes regularizadas garantiza un valor calculado de las propiedades mecánicas con una alta probabilidad, lo cual es un requisito indispensable para la solución del modelo planteado en las ecuaciones 4, 5 y 6. Con este resultado se puede definir el destino de las hornadas de metal que resulta más racional para la empresa siderúrgica, asegurando los indicadores de calidad solicitados en los pedidos de los clientes. Esto trae consigo una mejor administración de los recursos y de la materia prima de la empresa.

 

CONCLUSIONES

La utilización de redes neuronales de base radial entrenadas con el algoritmo de Landweber permite reducir considerablemente el error cuadrático medio y aumentar el coeficiente de determinación en la estimación de las propiedades mecánicas, en ambos talleres de laminación de la empresa siderúrgica, con respecto a los modelos estadísticos lineales y cuadráticos obtenidos en trabajos anteriores. Este resultado permite mejorar la calidad de las opciones de destino generadas para cada hornada, garantizando una mejor distribución de los recursos de la empresa. De esta forma se justifica plenamente la utilización de la técnica propuesta en el presente trabajo para la estimación de las propiedades, en sustitución de las ecuaciones de regresión.

 

REFERENCIAS

1. Krajewski L, Ritzman LP, Malhotra MK. Operation Management: Processes and Supply Chains. USA: Pearson; 2013. [Citado julio de 2016] Disponible en: http://www.yazdanpress.com

2. Jiang G, He E, Li G, et al. Production Line Production Planning Model of Iron and Steel Enterprise. Journal of Digital Information Management. 2013;11(2):131-5.

3. Liu S, Tang J, Song J. Order-planning model and algorithm for manufacturing steel sheets. International Journal of Production Economics. 2006;100(1):30-43.  

4. Zhang T, Chaovalitwongse WA, Zhang Y, et al. The hot-rolling batch scheduling method based on the prize collecting vehicle routing problem. Journal of Industrial and Management Optimization. 2009;5(4):749-65.  

5. Stawowy A, Duda J. Modelsand Algorithms for ProductionPlanning and Scheduling In FoundriesCurrent State and Development Perspective. Archives of Foundries. 2012;12(2):69-74.  

6. Zhang T, Zhang Y, Zheng QP, et al. A hybrid particle swarm optimization and tabusearch algorithm for order planning problems of steel factories based on the make-to-stock and make-to-order management architecture. Journal of Industrial and Management Optimization. 2011;7(1):31-52.  

7. Ashby MF. Materials Selection in Mechanical Design. USA: Elsevier Ltd; 2011. [Citado diciembre de 2016] Disponible en: https://jp4.journaldephysique.org/articles/jp4/abs/1993/07/jp4199303C701/jp4199303C701.html.

8. Arzola J. Sistemas de Ingeniería. La Habana, Cuba: Editorial Félix Varela; 2012. [Citado enero de 2017] Disponible en: https://www.researchgate.net/publication/271505692_Arzola_J_Sistemas_de_Ingenieria_Engineering_Systems_Felix_Varela_Publishing_House_Havana_2000

9. Jovanović RZ, Sretenovic AA. Ensemble of Radial Basis Neural Networks with k-means Clustering for Heating Energy Consumption Prediction FME Transactions. 2017;45:51-7. 

10. Binaghi E, Pedoia V, Guidali A, et al. Snow cover thickness estimation using radial basis function networks. The Cryosphere. 2013;7:841-54.  

11. Arliansyah J, Hartono Y. Trip attraction model using radial basis function neural networks. Procedia Engineering. 2015;125:445-51.  

12. Ji W, Sun L, Wang K, et al. Learning Methods of Radial Basis Function Neural Network. Journal of Chemical and Pharmaceutical Research. 2016;8(4):457-61.  

13. Camps L, Fraga H, Beccenery JC, et al. The fault diagnosis inverse problem with Ant Colony Optimization and Ant Colony Optimization with dispersion. Applied Mathematics and Computation. 2013;227:687-700.  

14. Moura Neto FD, Silva Neto AJ. An introduction to inverse problems with applications. New York, USA: Springer; 2013.

15. Kirsh A. An introduction to the mathematical theory of inverse problems. New York, USA: Springer; 2011.

16. Jin Q. A discrete Scheme of Landweber Iteration for solving Nonlinear Ill- Posed Problems. Journal of Mathematical analysis and Applications. 2001;253:187-203.  

17. Zhang H, Cheng LZ. Projected Landweber iteration for matrix completion. Journal of Computational and Applied Mathematics. 2010;235:593-601.  

 

 

Recibido: 11/1/2017

Aceptado: 30/6/2017

 

 

Doniel Jiménez-Sánchez, Universidad Tecnológica de La Habana José A. Echeverría, Centro de Estudios de Matemática. La Habana, Cuba. Correo electrónico: djimenez8988@gmail.com

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License