Citation
Fombellida de la Fuente, Ángel
(2019).
Diseño e implementación de un sistema de análisis de datos de calidad del aire, tráfico, climatología e incidencias de la ciudad de Madrid.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.
Abstract
Un grave problema que afecta a las grandes ciudades, como Madrid, es el de la contaminación del aire. Cuanta más información se dispone sobre un problema, más fácil es resolverlo o, al menos, mitigarlo. El principal objetivo de este proyecto es la creación de un sistema de análisis de datos que permita obtener información detallada y útil sobre el problema de la contaminación del aire de Madrid, y como se ve relacionado con el tráfico, el tiempo atmosférico y las incidencias en la vía pública de la ciudad. Este sistema está formado por una base de datos en tiempo real, un conjunto de procesos ETL (siglas en inglés de extraer, transformar y cargar) encargados de poblarlas con datos de cuatro fuentes de datos abiertos: calidad del aire, tráfico, tiempo atmosférico e incidencias; y una aplicación web para visualizarlos. Una vez se dispone de este sistema, se realiza el análisis de los datos, analizando primero datos de cada fuente de forma independiente y, después, datos de varias fuentes relacionadas entre sí. Este último es el de mayor interés para el proyecto, aunque los otros también son muy útiles. Tras realizar los análisis oportunos, se ha llegado a la conclusión de que el tráfico es uno de los principales contribuyentes a la contaminación de la ciudad, aunque no el único. También se ha podido observar que la zona de bajas emisiones conocida como “Madrid central”, impulsada por el ayuntamiento y que ha generado multitud de polémicas, está ayudando a mejorar la calidad del aire. Otras conclusiones secundarias que se han extraído son la relación entre las incidencias de la ciudad y el tráfico o entre la calidad del aire y el tiempo atmosférico.
Abstract:
A serious problem that affects big cities, like Madrid, is air pollution. The more information available about a problem, the easier it is to solve it or, at least, reduce it. The main goal of this project is the creation of a data analysis system that allows to get detailed and useful information about the problem of Madrid air pollution, and how it is related with traffic, weather, and incidents in the streets. This system is formed by a real time data base, a set of ETL (extract, transform, load) processes that populate ir with data from four open data sources: air quality, traffic, weather and incidents in the streets; and a web application to visualize them. Once this system is availabe, the data analysis is performed, first analyzing data from each source independently and, then, data from several data sources related to each other. The last is of biggest interest for the project, although the others are very useful too. After performing the appropiate analysis, it was observed that one of the main contributors to air pollution is traffic, but it is not the only one. It was also observed that the low emissions area known as “Madrid central”, promoted by the town hall, that created a lot of trouble, is helping to improve air quality. Other secondary conclusions that were reached are the relation between traffic and incidents in the streets or between weather and air pollution.