Nuevos modelos de redes de neuronas artificiales para simulación y control desistemas dinámicos

Galván León, Inés María (1997). Nuevos modelos de redes de neuronas artificiales para simulación y control desistemas dinámicos . Tesis (Doctoral), Facultad de Informática (UPM) [antigua denominación].

Descripción

Título: Nuevos modelos de redes de neuronas artificiales para simulación y control desistemas dinámicos
Autor/es:
  • Galván León, Inés María
Director/es:
  • Barrios Rolania, María Dolores
Tipo de Documento: Tesis (Doctoral)
Fecha: 1997
Materias:
Escuela: Facultad de Informática (UPM) [antigua denominación]
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (791kB) | Vista Previa

Resumen

Uno de los principales problemas en el campo de los procesos dinámicos es el control de su comportamiento, control que es necesario para que la evolución del proceso se lleve a cabo en una dirección y con una cierta dinámica deseada. Esto puede traducirse en mantener una condición estable, seguir una trayectoria especificada o alcanzar una determinada meta. Para ello es necesario incluir un sistema de control, el cual influye en la dinámica del proceso, regulando su comportamiento. La teoría de sistemas ha sido ampliamente desarrollada en las últimas cinco décadas, por lo que en la actualidad existe una gran variedad de técnicas de control. Dichas técnicas, en su mayoría, hacen uso de una representación matemática del proceso, también llamada modelo del proceso, permitiendo así la construcción de sistemas de control cuya actuación está basada en la propia naturaleza del proceso dinámico. A pesar de que la gran mayoría de los procesos reales son no lineales, la mayor parte de las técnicas de control se han desarrollado para procesos dinámicos lineales. En los últimos años ha habido, sin embargo, un interés creciente en incorporar técnicas no lineales, tanto para tratar el problema del control de procesos dinámicos, como para afrontar el problema de su modelización. En el desarrollo de técnicas de control no lineales, las redes de neuronas artificiales ocupan un lugar importante. Características tales como la naturaleza adaptativa y la capacidad para aproximar y aprender relaciones complejas no lineales a partir de un conjunto de ejemplos o patrones, hacen que sean buenas candidatas para tratar el problema de la modelización y el control de procesos dinámicos no lineales. Como Introducción 3 consecuencia, en los últimos diez años aproximadamente ha surgido una gran variedad de trabajos, en los que se utilizan diferentes arquitecturas y métodos de aprendizaje para la construcción de modelos y sistemas de control no lineales (ASMC, 92). Los modelos estudiados en este trabajo pertenecen a la categoría de modelos NARMA, los cuales son una extensión no lineal de los modelos ARMA (Auto-Regressive Moving Average) y se caracterizan porque describen el comportamiento dinámico del proceso a partir de las variables observables o medibles. Estos modelos son generalmente más fáciles de construir y tratar que los modelos físicos o modelos construidos a partir de leyes físicas que rigen el comportamiento dinámico del proceso, los cuales suelen ser modelos complicados, ya que intervienen un gran número de ecuaciones diferenciales, su construcción es laboriosa y requiere normalmente de una gran cantidad de tiempo y experimentos. Los modelos NARMA neuronales más populares son los llamados modelos de identificación en serie-paralelo, los cuales consisten en aproximar la relación no lineal utilizando el perceptron multicapa o una red de base radial, también conocidas como redes de neuronas estáticas, ya que la representación o el procesamiento de información temporal no es una propiedad intrínseca a ellas. En este caso, los patrones de entrada a la red son vectores que contienen las variables de entrada y salida del proceso, así como una historia de dichas variables, de modo que pueda ser representada la información temporal. Un modelo apropiado de un proceso tiene que poseer la propiedad de saber actuar como simulador del proceso. Esto significa que, dado el estado inicial del proceso y la variable de entrada, el modelo tiene que aproximar o predecir la dinámica de dicho proceso durante un cierto intervalo de tiempo, utilizando únicamente dicha información. Los modelos de identificación en serie-paralelo presentan el inconveniente de que no pueden utilizarse para simular la dinámica del proceso, ya que para predecir la salida actual del proceso es necesario conocer una historia de dicha variable, datos que no están disponibles cuando se simula el comportamiento del proceso dinámico. Algunos autores, (NAPA, 90), han propuesto reemplazar estos valores medibles en el modelo de identificación en serie-paralelo por los valores predichos por la red en instantes anteriores de tiempo, cuando sea necesario disponer de un simulador, obteniendo los llamados modelos de identificación en paralelo. Sin embargo, en los Introducción 4 estudios realizados en este trabajo se observa que los modelos en paralelo propuestos por estos autores, no siempre proporcionan aproximaciones adecuadas y convenientes del proceso dinámico, e incluso pueden existir situaciones en las que la capacidad de representación de estos modelos quede prácticamente anulada. Con respecto a las estrategias de control, en esta tesis se analizan dos sistemas diferentes de control no lineal, denominados control inverso y control predictivo. Ambas estrategias han sido ya estudiadas por diferentes autores, (JORD, 89), (NAPA, 90), (WIMO, 91), entre otros, aunque siguen aún presentando en la actualidad una serie de limitaciones e inconvenientes, sobre todo en lo referente a aplicaciones en tiempo real, las cuales se especifican brevemente a continuación. Las estrategias de control inverso, básicamente, consisten en entrenar una red de neuronas para que aprenda la dinámica inversa del proceso. Cuando se plantea un esquema de control inverso se distinguen dos formas diferentes de aprendizaje del controlador, que se denominan aprendizaje generalizado y aprendizaje especializado, respectivamente. La finalidad del aprendizaje generalizado es que la red aprenda la dinámica inversa del proceso, en su totalidad, a partir de un conjunto de datos representativos de dicha dinámica. Mediante el aprendizaje especializado, sin embargo, la red aprende la inversa local del proceso en la región de interés, utilizando la diferencia entre la salida actual del proceso y la salida deseada para adaptar los pesos del controlador. En este caso no es necesario disponer de un conjunto de patrones salida-entrada del proceso, sino que los datos para el aprendizaje proceden de la evolución directa de dicho proceso. Los esquemas de control inverso con aprendizaje generalizado son sistemas de control off-line, es decir, el aprendizaje de la red tiene que realizarse antes de su actuación como controlador del proceso dinámico real. Por tanto, el éxito del controlador depende en gran medida de los datos disponibles y de la capacidad de generalización de la red, factores que impiden, en la mayor parte de los casos, obtener un control eficiente del proceso dinámico real. Por otra parte, no es un esquema de control aplicable a cualquier proceso dinámico, ya que es necesario que la dinámica inversa de dicho proceso esté bien definida. Introducción 5 El esquema de control inverso con aprendizaje especializado se considera, sin embargo, un esquema de control on-line o en tiempo real, por lo que el aprendizaje de la red de neuronas se lleva a cabo mientras controla el proceso. Es, por tanto, una aproximación más conveniente y exacta, pues la red aprende a conseguir un objetivo de control, el dictado por las necesidades de cada momento. No obstante, y debido, precisamente, a que se trata de un esquema de control on-line, la inicialización de los pesos del controlador tiene una repercusión importante en los resultados de control; una inicialización no adecuada del controlador inverso cuando se dispone a realizar el aprendizaje especializado utilizando el proceso real, podría provocar situaciones de inestabilidad o incluso de “no control” en el proceso, lo cual no es admisible en aplicaciones en tiempo real. Debido a que la señal de control en un cierto instante de tiempo no sólo influye en la respuesta del proceso en el instante siguiente, sino también en un cierto futuro, es interesante utilizar esquemas de control que hagan uso de cierta información en el futuro para calcular la acción de control en el presente, y poder así obtener controladores más eficientes. Estos sistemas de control son los llamados controladores predictivos. Las estrategias de control predictivo consisten en calcular, en cada instante de tiempo, la acción de control que minimice la diferencia entre la salida de un modelo del proceso y la salida deseada durante un cierto intervalo de tiempo en el futuro, cuya longitud viene dada por el horizonte de predicción. Los modelos más empleados en estos sistemas de control han sido los clásicos modelos ARMA lineales (WIMO, 91), ya que, debido precisamente a su estructura lineal, el problema de optimización que engloba estas estrategias es lineal. Sin embargo, la capacidad de representación de los modelos ARMA para procesos dinámicos no lineales es bastante limitada. Por otra parte, la utilización de modelos no lineales para predecir el comportamiento del proceso en el futuro involucra la resolución de un problema de optimización no lineal en cada instante de tiempo, lo cual es un serio inconveniente cuando se trata de aplicaciones de control en tiempo real, ya que normalmente requieren de un alto esfuerzo computacional. Generalmente, este hecho hace que las estrategias de control predictivo que hacen uso de un modelo no lineal sean impracticables en aplicaciones reales. Introducción 6 Con vistas a superar los inconvenientes anteriores, en esta tesis se plantean los siguientes objetivos fundamentales: 1º Obtener modelos NARMA neuronales que puedan proporcionar una aproximación conveniente del proceso dinámico no lineal cuando dichos modelos actúan como simulador del proceso y resolver así los inconvenientes que puedan presentar los modelos de identificación en paralelo mencionados anteriormente. 2º Encontrar métodos que proporcionen inicializaciones de los parámetros del controlador neuronal inverso, de modo que pueda obtenerse un control eficiente del proceso dinámico real cuando se aplica un esquema de control inverso con aprendizaje especializado. 3º Construir sistemas de control predictivo no lineales aplicables en tiempo real y que requieran de un menor esfuerzo computacional que los esquemas de control predictivo existentes en la actualidad. Para cubrir los objetivos marcados, la tesis se estructura en cuatro capítulos. En el primero de ellos, capítulo 1, se da una panorámica sobre las redes de neuronas artificiales y sobre los procesos dinámicos, presentándose conceptos que serán utilizados. En este capítulo se incluye también el estado del arte del uso de las redes de neuronas artificiales para tratar el problema de la modelización y el control de procesos dinámicos no lineales. El capítulo 2 está dedicado al planteamiento del problema, presentándose las dificultades encontradas en los modelos de identificación en serie-paralelo para actuar como simulador del proceso y las limitaciones de las estrategias de control inverso y predictivo para controlar procesos dinámicos no lineales en tiempo real. En el capítulo 3 se presentan las soluciones propuestas para resolver los problemas planteados en el capítulo anterior y conseguir así los objetivos marcados. Dicho capítulo contiene, en primer lugar, la descripción de la arquitectura de red parcialmente recurrente que se propone utilizar, tanto para la construcción de simuladores como Introducción 7 controladores de procesos dinámicos no lineales, y el algoritmo de aprendizaje para llevar a cabo su entrenamiento. En segundo lugar, se analiza la incapacidad de los modelos de identificación en paralelo mencionados anteriormente para representar adecuadamente el proceso dinámico, proponiéndose una solución para resolver los problemas que se presentan. Finalmente, se desarrollan los esquemas de control inverso y predictivo propuestos en este trabajo. El capítulo 4 está dedicado a la validación de las soluciones propuestas en el capítulo anterior. Para ello se utiliza un proceso dinámico real que describe el comportamiento de la temperatura del fluido que circula en la camisa de un reactor químico situado en el Centro Común de Investigación de la Comunidad Europea de Ispra (Italia) y dentro del marco del proyecto FIRES (Facility for Investigating Runaway Events Safely). En este capítulo se realiza la descripción del reactor y de los circuitos de calentamiento y enfriamiento, la aplicación de las técnicas propuestas para modelizar y controlar el proceso dinámico en cuestión y finalmente un análisis de los resultados obtenidos. Con la finalidad de comprobar la validez de las técnicas desarrolladas para afrontar la modelización y el control de procesos dinámicos no lineales, este capítulo incluye también los resultados que proporciona un modelo físico que describe el comportamiento dinámico de la temperatura del fluido de intercambio de calor (ZALD, 95), así como los resultados de control que se obtienen con el controlador actualmente incorporado en la instalación (controlador PID: proporcional-integral-derivativo). Para finalizar, se establecen las conclusiones del trabajo desarrollado y posibles líneas futuras de investigación en este campo.

Más información

ID de Registro: 9500
Identificador DC: http://oa.upm.es/9500/
Identificador OAI: oai:oa.upm.es:9500
Depositado por: Archivo Digital UPM
Depositado el: 25 Oct 2011 10:04
Ultima Modificación: 20 Abr 2016 17:53
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM