Texto completo
|
PDF (Portable Document Format)
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (12MB) |
| Título: | Desarrollo de modelos de deep learning para la implementación de soft sensor de variables en procesos industriales |
|---|---|
| Autor/es: |
|
| Director/es: |
|
| Tipo de Documento: | Trabajo Fin de Grado o Proyecto Fin de Carrera |
| Grado: | Grado en Matemáticas e Informática |
| Fecha: | Junio 2025 |
| Materias: | |
| ODS: | |
| Palabras Clave Informales: | Soft sensors, Deep learning, Series temporales, Optimización de procesos, Inteligencia artificial industrial, Modelado basado en datos, Time series, Process optimization, Industrial artificial intelligence, Data-driven modeling |
| Escuela: | E.T.S. de Ingenieros Informáticos (UPM) |
| Departamento: | Matemática Aplicada a las Tecnologías de la Información y las Comunicaciones |
| Licencias Creative Commons: | Reconocimiento - Sin obra derivada - No comercial |
|
PDF (Portable Document Format)
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (12MB) |
El auge de la inteligencia artificial en la última década ha revolucionado la forma en la que se abordan los procesos industriales. Su aplicación en sectores como la energía o la petroquímica ha permitido optimizar operaciones, reducir costes y mejorar la calidad de los productos. Uno de los desafíos existentes en estos entornos es la monitorización de variables críticas que, en ocasiones, por motivos técnicos, económicos o de seguridad, no pueden ser medidas en tiempo real. En instalaciones complejas como las de la empresa Repsol, existen casos en los que el acceso directo a algunas variables es limitado. En consecuencia, se ha generado la necesidad de estimar ciertas variables indirectamente, y es en este contexto donde surgen los llamados soft sensors. Un soft sensor o sensor virtual, permite inferir el valor de variables críticas o no accesibles a partir de otras disponibles de forma continua. Se trata de modelos que pueden desarrollarse de dos maneras, desde un enfoque físico, basado en principios fundamentales del proceso, o puramente basado en datos. Este último está cada vez más extendido gracias a la disponibilidad de históricos operativos y al avance de técnicas de inteligencia artificial basadas en Machine Learning y Deep Learning. A pesar de su potencial, se plantean una serie de desafíos al tratar con datos de procesos industriales reales: datos ruidosos o incompletos, relaciones complejas entre variables, retardos temporales y cambios en condiciones de operación. El objetivo principal de este proyecto es desarrollar un soft sensor basado en modelos de Deep Learning para predecir en línea variables de control en una columna de destilación de C3-C4 de una planta industrial de Repsol. La solución propuesta se apoya en datos operativos reales proporcionados por la empresa. La primera fase del proyecto incluye un análisis exploratorio detallado, selección de variables relevantes, limpieza de datos, interpolación de valores atípicos y escalado de todas las señales. Se han definido diez variables clave, agrupadas según su función operativa, y se ha seleccionado un intervalo reciente de 45 días, representativo del comportamiento habitual de la planta, con un total de 64.800 observaciones. En la segunda fase se ha realizado el modelado de la solución propuesta. Se han implementado distintas arquitecturas buscando abarcar diferentes enfoques, con el fin de compararlos posteriormente. El proceso comienza con modelos baseline, que sirven como referencia para establecer una base. A partir de ellos, se continúa con algoritmos de Machine Learning basados en árboles de decisión como Random Forest y XGBoost, así como redes neuronales del estado del arte para problemas temporales: LSTM, TCN, DLinear, NLinear y Temporal Fusion Transformer (TFT). Todos estos modelos son evaluados en distintos horizontes de predicción (hasta 45 minutos) sobre el conjunto de test, aplicando métricas estándar de regresión. Además, se generan visualizaciones temporales que permiten identificar la alineación entre las predicciones y los valores reales, tanto en tramos amplios como en ventanas puntuales. Este análisis no solo valora el rendimiento global, sino que también facilita identificar cuándo y por qué cada modelo resulta más o menos preciso, así como detectar patrones de error según el tipo de variable o la dinámica del proceso. Las arquitecturas LSTM, DLinear y NLinear han demostrado un mejor rendimiento que modelos más avanzados como la TFT. Estas han alcanzado valores de MAPE de entre un 0,36 % y 1,5 %, y coeficientes de determinación (R2 ) muy cercanos a 1 en horizontes de predicción cortos, aunque con cierta degradación a medida que se amplía el rango de predicción. Los resultados obtenidos muestran que hay un gran potencial en el uso de estos modelos en entornos industriales. Se refleja la capacidad real del sistema para anticipar el comportamiento del proceso, sin necesidad de recurrir a modelos más sofisticados. El trabajo proporciona una metodología completa y replicable para el desarrollo de soft sensors basados en datos, adaptada a las características específicas de un entorno industrial real. Además, abre la puerta a futuras líneas de trabajo orientadas a la incorporación de modelos probabilísticos, la integración directa de estos sistemas en planta o su aplicación en simulaciones de procesos.
ABSTRACT
The rise of artificial intelligence in the last decade has revolutionized the way in which industrial processes are approached. Its application in sectors such as energy or petrochemicals has enabled the optimization of operations, cost reduction and improvement in product quality. One of the existing challenges in these environments is the monitoring of critical variables that, due to technical, economic or safety reasons, cannot always be measured in real time. In complex facilities such as those operated by Repsol, there are cases where direct access to certain variables is limited. Consequently, the need has arisen to estimate some variables indirectly, which is where so-called soft sensors come into play. A soft sensor, or virtual sensor, infers the value of complex or inaccessible variables based on others that are continously available. These models can be developed in two main ways: using a physics based approach, grounded in fundamental process principles, or purely data-driven. The latter has become increasingly widespread due to the availability of operational historical data and advances in artificial inteligence techniques based on Machine Learning and Deep Learning techniques. Despite their potential, several challenges arise when working with real industrial process data: noisy or incomplete data, complex relationships between variables, time delays and changes in operating conditions. The main objective of this project is to develop a soft sensor based on Deep Learning models to predict control variables in real time in a C3-C4 distillation column from Repsol industrial plant. The proposed solution relies on real operational data provided by company. The first phase of the project includes a detailed exploratory data analysis, selection of relevant variables, data cleaning, outlier interpolation and signal scaling. Ten key variables are defined, grouped according to their operational function, and a recent 45-day interval is selected, representative of the plant’s usual behavior, with a total of 64,800 observations. In the second phase, the proposed solution is modeled. Several architectures are implemented to cover different approaches, allowing for subsequent comparison. The modeling begins with baseline models that serve as a reference. From there, the work progresses to classical Machine Learning algorithms based on decision trees, such as Random Forest and XGBoost, as well as state-of-the-art neural network architectures for time series problems: LSTM, TCN, DLinear, NLinear and Temporal Fusion Transformer (TFT). All these models are evaluated across different prediction horizons (up to 45 minutes) on the test set, using standard regression metrics. Temporal visualizations are also generated to assess alignment between predictions and actual values, both across longer sequences and within specific time windows. This made it possible not only to evaluate overall performances but also to identify when each model is more or less accurate and to analyze error patterns depending on variable type or process dynamics. LSTM, DLinear, NLinear architectures demonstrate better performance than more advanced models like TFT. These models achieved MAPE values between 0.36% and 1.5%, and determination coefficients (R2 ) close to 1 for short prediction horizons, though performance declined as the forecast range increased. The results highlight the strong potential of these models in industrial environments. The system proves capable of anticipating process behavior without the need for more sophisticated architectures. This work provides a complete and replicable methodology for developing databased soft sensors, tailored to the specific characteristics of a real industrial setting. Moreover, it opens the door to future work focused on incorporating probabilistic models, integrating these systems directly into the plant, or applying them in process simulations.
| ID de Registro: | 89953 |
|---|---|
| Identificador DC: | https://oa.upm.es/89953/ |
| Identificador OAI: | oai:oa.upm.es:89953 |
| Depositado por: | Biblioteca Facultad de Informatica |
| Depositado el: | 14 Jul 2025 15:16 |
| Ultima Modificación: | 15 Jul 2025 05:29 |
Publicar en el Archivo Digital desde el Portal Científico