Modelado mediante Random Forests de las emisiones de autobuses urbanos en función de los ciclos cinemáticos

Pita González-Campos, Víctor (2017). Modelado mediante Random Forests de las emisiones de autobuses urbanos en función de los ciclos cinemáticos. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Descripción

Título: Modelado mediante Random Forests de las emisiones de autobuses urbanos en función de los ciclos cinemáticos
Autor/es:
  • Pita González-Campos, Víctor
Director/es:
  • Mira McWilliams, José Manuel
  • Arenas Ramírez, Blanca del Valle
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería en Tecnologías Industriales
Fecha: Febrero 2017
Materias:
Palabras Clave Informales: Emisiones, contaminante, autobús, CO2, NOx, partículas, Random Forests, MAPE, MSE, retardo, importancia de las variables, intervalos de confianza.
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Ingeniería de Organización, Administración de Empresas y Estadística
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) | Vista Previa

Resumen

El presente Trabajo de Fin de Grado se enmarca dentro del proyecto CICLOPE, desarrollado por el Instituto de Investigación del Automóvil (INSIA) y por profesores de la ETSII. Este proyecto comienza en 2016 y tiene como objetivo el desarrollo de un sistema experto capaz de generar patrones de conducción para autobuses municipales, con los que sea posible reducir cualquiera de las emisiones de interés, en función de las condiciones medioambientales y las exigencias de servicio de transporte ofrecido. La contaminación de las ciudades está siendo un tema recurrente en los últimos años debido a las importantes afecciones que ocasiona tanto en el medio ambiente como en las personas. Los principales causantes de este problema son las emisiones generadas por los motores de combustión interna de los vehículos que, a diario, circulan por sus calles. Esto ha dado pie a la realización de numerosos estudios cuyo fin es la determinación de las variables más importantes que influyen en dichas emisiones, con el objetivo de establecer patrones de conducción que permitan minimizarlas. Además, la innovación en el desarrollo de nuevos vehículos apuesta por sistemas de reducción de emisiones y por el desarrollo de medios de transporte limpios libres de ellas. Las emisiones de los motores de combustión interna alternativos (MCIA) se pueden clasificar en emisiones contaminantes y gases de efecto invernadero. Las emisiones contaminantes tienen efectos adversos sobre el medio ambiente y sobre las personas. Participan en la formación de la lluvia ácida y del smog fotoquímico. En las personas, generan efectos sobre el sistema respiratorio e irritaciones y algunos pueden ser tóxicos o cancerígenos. Los contaminantes más importantes de los MCIA son: CO, NOx, partículas e hidrocarburos. El principal gas de efecto invernadero emitido por los vehículos es el CO2.Muchos estudios apuntan al aumento de concentración de este gas en la atmósfera como la principal causa del incremento en la temperatura media global experimentado desde mediados del siglo XX. En cierta medida, la emisión de unos contaminantes u otros depende del tipo de motor de combustión. Así, los motores diésel (motores de encendido por compresión MEC) son los principales emisores de NOx y de partículas. El CO2 es el principal producto de los procesos de combustión de los MCIA y su formación no depende del tipo de motor. Puesto que los vehículos de transporte municipal utilizan motores diésel, se va a centrar el estudio en las emisiones de NOx, partículas y CO2. Este trabajo se centra en el estudio a nivel microscópico de las emisiones mencionadas: CO2, NOx y partículas, con el objetivo de identificar las variables que influyen en el caudal instantáneo emitido de cada contaminante y desarrollar modelos de predicción que traten de estimar estos caudales en función de los valores que tomen las variables explicativas identificadas. Para ello se cuenta con una base de datos de ensayos realizados en condiciones reales sobre autobuses de la Empresa Municipal de Transportes de la ciudad de Madrid. El análisis y la generación de modelos se van a realizar utilizando la herramienta estadística Random Forests. El estudio se va a realizar desde un enfoque estadístico, utilizando para el desarrollo de los modelos de predicción una herramienta moderna, los Random Forests, comúnmente utilizada en problemas de regresión y clasificación. Los Random Forests utilizados son los creados a partir de árboles de tipo CART. Los CART (Classification and Regression Trees) son árboles de clasificación o regresión, en función del tipo de variable de respuesta del problema, que configuran sistemas de predicción a partir de un conjunto inicial de datos mediante un algoritmo sencillo basado en particiones binarias. Estas particiones, que configuran los nodos del árbol, dividen de forma recursiva el espacio de n dimensiones (configurado por las n variables de entrada del modelo) en dos regiones según el valor de una de las variables, con el fin de conseguir una ganancia de información y una mejor clasificación de los datos. Al final del proceso de formación se genera una estructura de árbol que predice el valor de la variable de salida del problema en función de los valores que toman las variables de entrada. Los Random Forests son bosques constituidos por árboles de clasificación o regresión, creados mediante un algoritmo que introduce dos fuentes de aleatoriedad en la generación de dichos árboles con el objetivo de reducir la correlación entre ellos y mejorar las predicciones. Una vez generado el bosque, la predicción se toma promediando las predicciones individuales de los árboles. La primera fuente de aleatoriedad es el Bootstrapping, técnica frecuentemente utilizada en algoritmos de aprendizaje automático que consiste en utilizar para la creación de cada árbol una muestra distinta, obtenida sobre el conjunto inicial mediante una elección aleatoria de los datos con reemplazamiento. La otra fuente de aleatoriedad consiste en limitar el número de variables de entrada candidatas a provocar la partición en cada nodo a un número prefijado (mtry < n), seleccionando al azar las mtry variables de entre las n posibles variables de entrada. De esta forma se crean árboles diferentes no correlacionados. Para la realización del estudio se dispone de una base de datos de ensayos realizados en condiciones reales en un autobús de línea de la EMT de Madrid que recoge las medidas tomadas en términos de emisiones, variables cinemáticas, posicionales y ambientales. En cada ensayo, las medidas están tomadas con una frecuencia de 1 segundo. Estos ensayos fueron realizados en los años 2007 y 2008 para un mismo vehículo con distintos combustibles: diésel y biodiésel (B100), y distintos estados de carga: vacío, media carga, plena carga. El procedimiento llevado a cabo para el análisis de la base de datos y generación de los modelos es el mismo para cada contaminante y cuenta con las siguientes etapas: -Obtención de nuevas variables cinemáticas (aceleración y sobreaceleración) a partir de las medidas de velocidades instantáneas del bus contenidas en los ficheros de la base de datos. -Estudio de la secuencia de la curva cinemática con respecto a la curva de caudal emitido. El objetivo de esta etapa es identificar posibles desfases entre ambas curvas, debidos, principalmente, al sistema de medición de los ensayos. -Elección de subconjuntos de variables cinemáticas candidatas a formar el modelo final del contaminante. Estas variables elegidas se toman según los retardos de la curva cinemática identificados en el paso anterior. Se realizan pruebas con modelos Random Forests sencillos con el objetivo de determinar los subconjuntos que mejores resultados presentan. -Creación de los modelos finales añadiendo a los subconjuntos de variables cinemáticas elegidos el resto de variables disponibles: variables ambientales y estado de carga del bus. -Análisis de los resultados obtenidos para cada modelo y elección de aquél cuyas predicciones sean más precisas. -Análisis en detalle del modelo elegido. Estudio de la importancia de las variables, de la distribución del error y de los intervalos de confianza para las predicciones generadas por el modelo. Los principales criterios utilizados para la evaluación de la precisión de los modelos son la variabilidad explicada, el MAPE y el MSE. El MAPE y el MSE son errores de predicción calculados comparando las predicciones generadas por el modelo con los valores reales de caudal emitido. El MAPE es el error relativo medio y el MSE, el error cuadrático medio. Para cada uno de los tres contaminantes, CO2, NOx y partículas, se sigue paso a paso el procedimiento descrito. Las variables explicativas que alimentan estos primeros modelos se dividen en tres grupos: variables cinemáticas, ambientales y nivel de carga. Las cinemáticas son la velocidad, aceleración y sobreaceleración instantáneas. Las ambientales incluyen la temperatura, presión y humedad medidas en las condiciones del ensayo. Una vez elegidos los mejores modelos para cada uno de los contaminantes, se procede con el análisis en detalle de los resultados. En este análisis detallado de los primeros modelos desarrollados se advierten errores elevados de precisión en las predicciones generadas, con un gran número de observaciones con valores altos de error relativo y amplios intervalos de confianza para las predicciones. Aunque la variabilidad explicada alcanza valores superiores al 80%, el MAPE y el MSE toman valores elevados, denotando esta notable imprecisión de los modelos. Como consecuencia de los resultados obtenidos se deciden investigar las posibles causas que determinan la imprecisión de los modelos. Se determina que el origen de esta falta de precisión está en la omisión en la parte explícita de los mismos de una o varias fuentes importantes de variabilidad de los caudales emitidos. Un estudio con más detalle de las curvas cinemática y de contaminante lleva a la conclusión de que el valor instantáneo de las variables cinemáticas no es suficiente para explicar los valores que toma el caudal emitido en dicho instante. Además de esto es necesario conocer el valor que toma la variable de respuesta en instantes anteriores. Para probar si esta hipótesis es correcta se repiten los ensayos para los mejores modelos obtenidos de cada contaminante añadiendo retardos en la variable de respuesta (caudal emitido en instantes anteriores). Los resultados obtenidos tras la introducción de las nuevas variables muestran una mejora notable de la precisión de los modelos. El estudio y modelado de las emisiones instantáneas de un vehículo es un estudio muy complejo, en el que intervienen muchas variables de diferente naturaleza, siendo difícil el control de algunas de ellas, debidas principalmente al proceso de combustión. Según el enfoque de estudio elegido, con el desarrollo de los modelos de predicción tomando los valores instantáneos de las variables cinemáticas, las variables ambientales y el estado de carga del bus, y los creados además con los valores del retardo de la respuesta, la estadística indica que estos retardos son necesarios para modelar con mayor precisión las emisiones contaminantes. Sin embargo, los errores continúan siendo apreciables tras la introducción de los retardos, lo que indica la posible omisión de otras variables relevantes de las que no se tienen datos, como la pendiente del terreno. Por ello, es necesario seguir investigando con el objetivo de encontrar más variables explicativas que mejoren la precisión de los modelos.

Más información

ID de Registro: 45914
Identificador DC: http://oa.upm.es/45914/
Identificador OAI: oai:oa.upm.es:45914
Depositado por: Biblioteca ETSI Industriales
Depositado el: 17 May 2017 06:26
Ultima Modificación: 17 May 2017 06:26
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM