Estudio en Business Intelligence de accidentes de tráfico en España

Rodríguez Ardila, David Salomón (2020). Estudio en Business Intelligence de accidentes de tráfico en España. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Estudio en Business Intelligence de accidentes de tráfico en España
Author/s:
  • Rodríguez Ardila, David Salomón
Contributor/s:
  • Talavera Muñoz, Edgar
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: 2020
Subjects:
Freetext Keywords: Business Intelligence; Análisis de datos
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB)
[img] Archive (ZIP) - Users in campus UPM only
Download (319kB)

Abstract

El siguiente documento tiene como propósito mostrar los pasos realizados para un estudio de BI (Business Intelligence) de los accidentes de tráfico producidos en España en el año 2015, utilizando como origen de la información un catálogo de ficheros obtenidos desde la página oficial de la DGT (dirección General de tráfico). Desde el comienzo, la búsqueda de información para el desarrollo de un estudio BI partía inicialmente en encontrar una base de datos lo suficientemente grande y rica en información para poder explotarla, gracias a los concejos de los expertos en este campo de la universidad se ha encontrado tres puntos de información, el primero fue a partir del portal de datos abiertos de la comunidad de Madrid específicamente en el catálogo de datos del parque de bomberos de Madrid, otro punto de información fue el portal de datos abiertos de la comunidad europea con el tema de consumo de alimentos en Europa y por último el catálogo de datos abiertos sobre accidentes de tráfico de un organismo del gobierno Español, más conocido como la DGT, una vez obtenida la información de las tres fuentes se ha procedido al análisis de la información. De la información obtenida se ha llegado a la conclusión en usar la base de datos de la DGT, la elección de esta base de datos fue debido a que no se necesitaba normalizar la información y además la base de datos disponía de una mayor variedad de información que las demás. Después se realizó el tratamiento de la información para que pudiese ser cargado en la base de datos para su modificación. Una vez cargada la información en la base de datos, se aplicarán las metodologías encargadas para la construcción de un sistema de BI, donde primero se realizará la creación de un Data Mart, para ello se definirán las dimensiones y los hechos que entrarán en el estudio, una vez identificadas se creará la nueva base de datos con las tablas necesarias para definir el Data Mart, entre las metodologías existentes para la creación de estas estructuras se ha aplicado la de “modelado de un Data Mart”, esta metodología explica cómo se trasforma la información desde uno o varios puntos de origen remotos hasta el almacenamiento en un punto destino. Después se ha empleado la arquitectura para la construcción de los cubos OLAP, que permite gestionar los datos de forma que se puedan interpretar desde varios factores, para ello se han elegido los atributos del Data Mart que pueden entrar en la creación del cubo y por último se realizará la presentación de la información a partir de modelos gráficos por medio de una herramienta software que permita su visualización. Al final de este estudio se mostrará los datos obtenidos gráficamente de forma que puedan ser interpretados con mayor facilidad las causas de un accidente en las carretera, expresándolo desde distintas causas, mostrando así los beneficios obtenidos de aplicar un sistema de Business Intelligence. Las ventajas como la observación de los datos y su compresión más sencilla generan mejores posibilidades para las predicciones y las decisiones que se pueden tomar, además de poder distinguir aquellos factores que puede llegar a ser un riesgo para el negocio. Para este caso las víctimas de accidente de tráfico serán el proceso principal de este estudio. Abstract: The purpose of this Degree Final Project is to show the steps taken for a BI (Business Intelligence) study of traffic accidents produced in Spain in 2015, using as a source of information a catalogue of files obtained from the official DGT website (Dirección General de Trafico). From the beginning, the search for information for the development of a BI study initially started with the search for a database large enough and rich in information to be exploited, thanks to the advice of experts in this field from the university I found three information points, the first was from the open data portal of the community of Madrid specifically in the data catalog of the Madrid fire station, another point of information was the open data portal of the European community on the subject of consumption of food in Europe and finally, the catalog of open data on traffic accidents from a Spanish government agency, known as DGT, once the information was obtained from the three sources, the information was analysed. From the information obtained, the conclusion has been reached to use the DGT database, the choice of this database was due to the fact that it is not necessary to standardize the information and also the database has a greater variety of information than the others. Later it will be obtained the treatment of the information so that it can be loaded into the database for modification. Once the information is loaded into the database, the methodologies responsible for the construction of a BI system will be applied, where the creation of a Data Mart will first be executed, for which the dimensions and the facts that will enter will be defined. Once identified, the new database will be created with the necessary tables to define the Data Mart. Among the existing methodologies by the creation of these structures, "Data Mart modelling" has been applied. This methodology explains how information from one or more remote source points to storage is transformed into a destination point. Subsequently, the architecture for the construction of the OLAP cubes was used, which allows managing the data in such a way that they can be interpreted from various factors. For this, the attributes of the Data Mart that can enter the creation of the cube have been chosen, and finally, the information will be presented from graphic models using a software tool that allows its visualization. By the end of the study, the data obtained will be shown graphically so that the causes of a road accident can be more easily interpreted, expressing it from different causes, thus showing the benefits obtained from applying a Business Intelligence system. Advantages such as data observation and easier compression generate better possibilities for predictions and decisions that can be made, in addition to being able to distinguish those factors that can be a risk to the business. In this case, traffic accident victims will be the main process of this study.

More information

Item ID: 64513
DC Identifier: http://oa.upm.es/64513/
OAI Identifier: oai:oa.upm.es:64513
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 08 Oct 2020 18:30
Last Modified: 08 Oct 2020 18:31
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM