Aplicación de modelos de redes neuronales al modelado y predicción de emisiones de autobuses urbanos

Nova García, Adrián (2018). Aplicación de modelos de redes neuronales al modelado y predicción de emisiones de autobuses urbanos. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM), Madrid.

Descripción

Título: Aplicación de modelos de redes neuronales al modelado y predicción de emisiones de autobuses urbanos
Autor/es:
  • Nova García, Adrián
Director/es:
  • Mira McWilliams, José Manuel
  • Valle Arenas Ramírez, Blanca
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería en Tecnologías Industriales
Fecha: Febrero 2018
Materias:
Palabras Clave Informales: CO2, contaminante, emisiones, modelo, ensayo, Neural Networks, MAPE, MSE, Variabilidad explicada, error, retardo
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Ingeniería de Organización, Administración de Empresas y Estadística
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB) | Vista Previa

Resumen

Introducción Este Trabajo de Fin de Grado está integrado dentro del programa cuyas siglas son CICLOPE. Este proyecto se desarrolla conjuntamente por profesores de la Escuela Técnica Superior de Ingenieros Industriales y la Escuela Técnica superior de Ingenieros de Minas y Energía y por investigadores del Instituto de Investigación del Automóvil (INSIA). El estudio comienza en 2016 y tiene una duración de 3 años. El principal objetivo es poder reducir las emisiones de los autobuses mediante la obtención de patrones en función de variables cinemáticas y de las condiciones ambientales. Durante los últimos años la contaminación está siendo muy combatida en las grandes ciudades ya que son los lugares donde mayor concentración de partículas contaminantes hay. Esta contaminación puede afectar tanto al global del planeta como a los seres vivos que lo habitan. Los principales contribuyentes al aumento de la concentración de esas partículas son los motores de combustión interna alternativa (MCIA). Las emisiones que de desprenden estos motores varía según el modo en el que se produce la combustión, pero principalmente emiten gases de efecto invernadero y gases contaminantes. En este trabajo se centra el estudio en los gases de efecto invernadero debido a los efectos que puede tener para la salud y el medio ambiente a medio y largo plazo, y no dependen del tipo de motor, mientras que los NOx y las partículas sí son más específicos de los motores de encendido por compresión (MEC) propulsados por diésel. Estudios recientes han demostrado que los gases de efecto invernadero (en el caso de este trabajo CO2) han contribuido en gran medida al aumento de la temperatura media global del planeta. Por otro lado, los gases contaminantes como pueden ser los NOx y las partículas contribuyen al medio ambiente a más corto plazo y afectan de manera más rápida a la salud. Por estos motivos se han realizado numerosos estudios en los que el principal fin es la determinación de las variables más importantes que influyen en las emisiones, para poder establecer patrones de conducción que permitan reducirlas. Además, cada vez se introducen más mejoras en los nuevos motores que hacen que emitan menos contaminantes, a veces incluso se utilizan motores híbridos que reducen significativamente las emisiones. Por tanto, el estudio de este trabajo se centrará en las emisiones de CO2, ya que los motores que utiliza la flota municipal de transportes son motores de compresión que emiten este gas. El objetivo del presente Trabajo de fin de Grado es el estudio a nivel microscópico de las emisiones contaminantes típicas de los buses urbanos, tratando de identificar las variables que influyen en la masa emitida de cada contaminante en un instante de tiempo determinado y desarrollando un modelo que trate de predecir este caudal que se va a emitir en cada instante en función de los valores que tomen las diferentes variables explicativas identificadas. Para la realización de estos modelos predictivos se dispone de una amplia base de datos proporcionada por el INSIA que contiene medidas de presión, temperatura, humedad, velocidad, altitud y caudal de contaminante para cada instante. Para analizar estos datos y generar nuevos modelos se utilizará la herramienta Neural Networks. Herramientas Se va a dar un enfoque estadístico a todos estos datos y se va a utilizar la herramienta Neural Networks. Las redes neuronales son un método de aprendizaje desarrollado en diferentes campos, uno la estadística y otro la inteligencia artificial, basados ambos en ideas y conceptos similares. La idea principal es extraer combinaciones lineales de las entradas como características derivadas, y una vez hecho eso, modelar el sistema como una función no lineal según esas características. La red neuronal más usada es una red llamada “vanilla” neural net, comúnmente llamada red de propagación de la parte posterior de la capa oculta, o simplemente capa única de percepción. Realmente, no son más que modelos estadísticos no lineales, como la gran mayoría de modelos estadísticos. Una red neuronal consta de parámetros desconocidos, normalmente conocidos como weights (pesos) y buscamos valores para ellos que hacen que el modelo se ajuste bien a los datos del training. Para el cálculo de estos weights, se utiliza la siguiente función R. Para hacer una aproximación genérica a la minimización de la función R, se utiliza pendiente descendiente, conocida como back-propagation. Gracias a la forma en que está compuesto el modelo, el gradiente puede derivarse de forma muy sencilla utilizando la regla de la cadena. Esto puede calcularse mediante un barrido hacia delante y hacia atrás de la red de manera que se vayan registrando las cantidades locales de cada unidad. A veces la red neuronal tiene pesos excesivamente altos(weights) y lo que hace es sobreajustar los datos del mínimo global de la función R. Para eliminar el sobreajuste se aplica en un weight decay (una disminución de peso). Normalmente los valores iniciales del peso (weights) se escogen de manera aleatoria y son cercanos al cero. Por tanto, el modelo empieza de manera lineal y poco a poco se va transformando en no lineal a medida que va creciendo peso (weights). Generalmente, es preferible que haya más unidades ocultas a que haya menos. Cuantas menos unidades ocultas haya, menos flexibilidad tendrá el modelo para detectar las no linealidades en los datos. El número de unidades ocultas puede verse incrementado o reducido en función del número de entradas y de los ensayos que se realicen. Base de datos Para la realización de este trabajo de fin de grado, el INSIA provee al alumno de una extensa base de datos que recoge datos cinemáticos, ambientales y de caudal de contaminantes emitidos de unas líneas de autobuses de la empresa municipal de transportes. Estas medidas están tomadas con un intervalo de tiempo de un segundo, por tanto, se tienen medidas de todas las variables anteriormente mencionadas cada segundo. Estas medidas están tomadas para tres estados de carga distintos: plena carga, media carga y vacío. El problema de estos datos es su antigüedad, puesto que fueron medidas tomadas durante los años 2007 y 2008. Además, son medidas tomadas para combustibles diésel y biodiésel (B100), estando actualmente el primer combustible en desuso en la propia empresa. Se genera un archivo csv para cada estado de carga en el que eliminamos la carga como variable categórica y no tenemos que pasarla a numérica. Procedimiento El procedimiento que se ha seguido para el tratamiento y procesado de los datos de CO2 ha sido el siguiente:• Análisis de los datos encontrados en los archivos Excel.• Una vez analizados y comprendidos todos los datos de los que se dispone, se procede al cálculo de las variables cinemáticas que se requieren, tanto la aceleración como la sobreaceleración. Ambas son dependientes de otras variables, por ejemplo, la aceleración en un instante depende de la velocidad en ese instante y la del instante anterior, mientras que la sobreaceleración depende de la aceleración en ese instante y en el anterior. Ambas irían divididas por el intervalo temporal que las separa, pero al ser 1 segundo se obvia.• Una vez calculadas esas variables, con sus respectivos retardos incluidos ya que se aprecia en la curva caudal velocidad la influencia de esos retardos, se procede a ver cuál de todas esas variables es más influyente en el modelo. Para ello se utiliza la herramienta Neural Network, en la que se debe utilizar la técnica de Holdout. Estos modelos deben ser sencillos, por lo que se tomarán 2000 datos y aplicando el Holdout se coge el 80% para los datos training y el 20% para los datos test.• El siguiente paso sería introducir las variables cinemáticas elegidas en el paso anterior junto con las variables ambientales. En este caso no es posible introducir las variables ambientales, ya que, al ser medidas casi idénticas, constantemente generan predicciones idénticas. • Se genera un modelo para cada estado de carga con las variables cinemáticas, utilizando la técnica de Holdout, en este caso para 5000 datos puesto que el algoritmo neuralnet no converge para más datos. • Análisis de cada estado de carga, eligiendo el que mejores resultados haya dado. • Analizar en detalle los resultados obtenidos, en cuanto a importancia de los retardos, error y variables que podrían mejorar el modelo El análisis de los modelos se hace a partir de la variabilidad explicada tanto de los datos training como de los datos test, a partir del MSE y del MAPE, ambos calculados para los datos test. Tanto el MSE como el MAPE son medidas del error, el primero es el error cuadrático medio y el segundo es el error relativo medio. Modelos sin retardos de la variable respuesta Para este apartado se realiza paso a paso lo comentado en el apartado anterior. Se divide el trabajo en tres ensayos distintos, según el estado de carga y se le añaden las variables cinemáticas que han resultado mejores para cada ensayo. Estos modelos van a dar unos resultados que se discuten posteriormente. Como se puede ver en la tabla 1, los resultados para los ensayos sin introducir los retardos son bastante pobres. Alcanzan unos valores muy altos tanto de MSE como de MAPE y valores de variabilidad explicada bajos muy cercanos al 50%, salvo a carga vacía que aporta unos resultados un poco mejores de variabilidad situándose en torno al 70%. Por tanto, esos errores tan elevados implican que la predicción no ha sido buena, por lo que habría que introducir nuevas variables que influyan en el modelo y no se hayan introducido en este apartado. Modelos con retardos de la variable respuesta. En este apartado se introducen los valores de la variable respuesta con retardo, es decir, tomados un instante o dos antes del valor real en ese instante. Por tanto, se cogen los ensayos que mejores resultados han aportado anteriormente y se le introduce estos retardos como una variable de entrada más. Entonces los resultados obtenidos en estos nuevos ensayos se pueden observar en la comparativa de la tabla 1. Con la introducción de los retardos, se ha conseguido aumentar la precisión de la predicción reduciendo en todos los casos el MSE y el MAPE. Además, se han obtenido unos valores mucho más altos que antes de variabilidad explicada situándose ahora en torno al 90%. Conclusiones A raíz de los resultados obtenidos (tabla 1) se puede concluir que los ensayos con retardos arrojan mejores resultados que aquellos en los que no se introducen los retardos. Pero esto no es suficiente ya que los valores del error siguen siendo un tanto altos. Esto puede ser debido a varios factores. Uno de ellos es debido a la limitación del algoritmo utilizado en cuanto a datos y variables a introducir, con otros modelos de predicción es posible que se puedan coger más datos e introducir más variables. Otro factor puede ser la no introducción de la variable pendiente, que no se ha introducido porque los datos que aporta el gps en su medición no son fiables. Aún con todo, predecir las emisiones es algo muy complejo, puesto que existen muchas variables que modifican los modelos sobre las cuales muchas veces es difícil tener control. Por ejemplo, el control que se tiene sobre la combustión del motor no es el mismo que el de la velocidad del vehículo.

Más información

ID de Registro: 49711
Identificador DC: http://oa.upm.es/49711/
Identificador OAI: oai:oa.upm.es:49711
Depositado por: Biblioteca ETSI Industriales
Depositado el: 14 Mar 2018 14:32
Ultima Modificación: 14 Mar 2018 14:32
  • InvestigaM
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM