Análisis sobre la contaminación en la ciudad de Madrid

Gallego García, Álvaro (2017). Análisis sobre la contaminación en la ciudad de Madrid. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Análisis sobre la contaminación en la ciudad de Madrid
Author/s:
  • Gallego García, Álvaro
Contributor/s:
  • Fernández del Pozo de Salamanca, Juan Antonio
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: 2017
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (7MB) | Preview

Abstract

El objeto de este trabajo es la creación de una aplicación, la cual a través de manipular datos referentes a la contaminación atmosférica ofrecidos por los diferentes portales de datos abiertos, obtenga un análisis descriptivo de la situación actual y unas predicciones fiables a corto plazo para valorar si las medidas que se están llevando acabo son eficaces y suficientes como para garantizar la salud y el bienestar de los ciudadanos de la ciudad de Madrid. Todo ello siguiendo la metodología CRISP-DM utilizada en proyectos de data science. Por ello se ha dedicado gran parte del tiempo en el estudio del arte y la comprensión de los datos, el preprocesado de los datos, su análisis, el análisis dependencias y la tendencia, además de varios ajustes realizados en el entorno de trabajo para las diversas etapas en las que consistirá el proyecto. Para ello, lo primero fue documentarme sobre las principales variables de la contaminación atmosférica, las técnicas de análisis de series temporales y las distintas librerías que ofrece R para su manejo. A continuación, explorar toda la información disponible en los sitios web del Ayuntamiento de Madrid y de la AEMET (Agencia Estatal de Meteorología), obteniendo la información al respecto de la calidad del aire en Madrid y del tiempo. Mediante el uso de tablas y gráficos ggplot, se muestran distintos agregados de datos según los años, los meses, las semanas y las horas, usando la media y la mediana como estimadores. También se muestra la tendencia, la cual luego se mostrará en estos gráficos mediante el método de cuadrados mínimos. Se ha realizado el análisis de variables dependientes en distintos instantes del tiempo, la obtención de un modelo Vector Auto Regresivo para la obtención de predicciones durante el 2017, y el despliegue de la misma aplicación para obtener gráficos, estadísticos y predicciones de manera dinámica. Finalmente se han tomado en consideración las medidas propuestas por el Plan de Acción A propuesto del Ayto. de Madrid para garantizar los objetivos medio y largo plazo. Además se ha hecho uso de tecnologías como Docker, Anaconda y Github para facilitar el desarrollo y seguimiento de este proyecto. ---ABSTRACT--- The goal of this project is to create an application, which, through manipulating data related to air pollution offered by the different open data websites, produces a descriptive analysis of the current situation and reliable predictions in the short term to evaluate if the measures that are being executed are effective and sufficient to guarantee the health and wellness of the citizens of Madrid. All this following the CRISP-DM methodology used in data science projects. Most of the time in this project has been spent on art study of environmental matters and data comprehension, data preprocessing, data analysis, as well as several adjustments on the work environment as long as the project progressed. Needless to say, the first thing I did was to dig into the most important pollutants in our days and all the protocols and decrees that currently trying to reduce them. Later on, I explored some of the different analysis techniques widely used in time series and the different libraries that R provides. Then I started to look for more open data that could be useful for this study mainly weather and traffic, since I already knew that Madrid’s city council had published this kind of information to public access. By the use of tables and ggplot graphics, different aggregated are shown yearly, monthly, weekly, daily and hourly, using average and median as estimators. Trend lines have been also plotted on them using least squares.

More information

Item ID: 47841
DC Identifier: http://oa.upm.es/47841/
OAI Identifier: oai:oa.upm.es:47841
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 21 Sep 2017 06:44
Last Modified: 21 Sep 2017 06:44
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM