Análisis sobre la contaminación en la ciudad de Madrid

Gallego García, Álvaro (2017). Análisis sobre la contaminación en la ciudad de Madrid. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Descripción

Título: Análisis sobre la contaminación en la ciudad de Madrid
Autor/es:
  • Gallego García, Álvaro
Director/es:
  • Fernández del Pozo de Salamanca, Juan Antonio
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería Informática
Fecha: 2017
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (7MB) | Vista Previa

Resumen

El objeto de este trabajo es la creación de una aplicación, la cual a través de manipular datos referentes a la contaminación atmosférica ofrecidos por los diferentes portales de datos abiertos, obtenga un análisis descriptivo de la situación actual y unas predicciones fiables a corto plazo para valorar si las medidas que se están llevando acabo son eficaces y suficientes como para garantizar la salud y el bienestar de los ciudadanos de la ciudad de Madrid. Todo ello siguiendo la metodología CRISP-DM utilizada en proyectos de data science. Por ello se ha dedicado gran parte del tiempo en el estudio del arte y la comprensión de los datos, el preprocesado de los datos, su análisis, el análisis dependencias y la tendencia, además de varios ajustes realizados en el entorno de trabajo para las diversas etapas en las que consistirá el proyecto. Para ello, lo primero fue documentarme sobre las principales variables de la contaminación atmosférica, las técnicas de análisis de series temporales y las distintas librerías que ofrece R para su manejo. A continuación, explorar toda la información disponible en los sitios web del Ayuntamiento de Madrid y de la AEMET (Agencia Estatal de Meteorología), obteniendo la información al respecto de la calidad del aire en Madrid y del tiempo. Mediante el uso de tablas y gráficos ggplot, se muestran distintos agregados de datos según los años, los meses, las semanas y las horas, usando la media y la mediana como estimadores. También se muestra la tendencia, la cual luego se mostrará en estos gráficos mediante el método de cuadrados mínimos. Se ha realizado el análisis de variables dependientes en distintos instantes del tiempo, la obtención de un modelo Vector Auto Regresivo para la obtención de predicciones durante el 2017, y el despliegue de la misma aplicación para obtener gráficos, estadísticos y predicciones de manera dinámica. Finalmente se han tomado en consideración las medidas propuestas por el Plan de Acción A propuesto del Ayto. de Madrid para garantizar los objetivos medio y largo plazo. Además se ha hecho uso de tecnologías como Docker, Anaconda y Github para facilitar el desarrollo y seguimiento de este proyecto. ---ABSTRACT--- The goal of this project is to create an application, which, through manipulating data related to air pollution offered by the different open data websites, produces a descriptive analysis of the current situation and reliable predictions in the short term to evaluate if the measures that are being executed are effective and sufficient to guarantee the health and wellness of the citizens of Madrid. All this following the CRISP-DM methodology used in data science projects. Most of the time in this project has been spent on art study of environmental matters and data comprehension, data preprocessing, data analysis, as well as several adjustments on the work environment as long as the project progressed. Needless to say, the first thing I did was to dig into the most important pollutants in our days and all the protocols and decrees that currently trying to reduce them. Later on, I explored some of the different analysis techniques widely used in time series and the different libraries that R provides. Then I started to look for more open data that could be useful for this study mainly weather and traffic, since I already knew that Madrid’s city council had published this kind of information to public access. By the use of tables and ggplot graphics, different aggregated are shown yearly, monthly, weekly, daily and hourly, using average and median as estimators. Trend lines have been also plotted on them using least squares.

Más información

ID de Registro: 47841
Identificador DC: http://oa.upm.es/47841/
Identificador OAI: oai:oa.upm.es:47841
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 21 Sep 2017 06:44
Ultima Modificación: 21 Sep 2017 06:44
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM