Modelo para la determinación de la exposición de los vehículos, a partir de los datos registrados en ITV, teniendo en cuenta sus características y antigüedad

Recio Viejo, José Ángel (2016). Modelo para la determinación de la exposición de los vehículos, a partir de los datos registrados en ITV, teniendo en cuenta sus características y antigüedad. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Description

Title: Modelo para la determinación de la exposición de los vehículos, a partir de los datos registrados en ITV, teniendo en cuenta sus características y antigüedad
Author/s:
  • Recio Viejo, José Ángel
Contributor/s:
  • Arenas Ramírez, Blanca
  • Mira McWilliams, Jose Manuel
Item Type: Final Project
Date: 2016
Subjects:
Freetext Keywords: CART,RPART, CTREE, Random Forest, minería de datos, estadística descriptiva, filtrado, movilidad o exposición, modelo , predicción.
Faculty: E.T.S.I. Industriales (UPM)
Department: Ingeniería Mecánica
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview

Abstract

Todos los países desarrollados aplican políticas de gestión del tráfico y Seguridad Vial, estas deben ir acorde según de los avances en la tecnología y la evolución social. Una de las vías para el desarrollo de estas políticas es conocer patrones de comportamiento y establecer niveles de riesgo para los distintos tipos de vehículos, para ello es necesario conocer los niveles de exposición de forma desagregada. Dentro de los distintos tipos de vehículos existe el colectivo de los Turismos que representa el 69,6% de las víctimas y el 52,2% de los fallecidos en accidentes de tráfico, por eso la importancia de conocer especialmente los patrones de la exposición de estos en las carreteras, de ahí que este proyecto se centre en este colectivo. El objetivo fundamental es determinar un modelo de la exposición de los vehículos turismos, desarrollando la metodología y herramientas para ello. Para el desarrollo del proyecto se utilizan técnicas de Minería de datos dado el volumen de datos a manejar, para establecer el grado de relevancia de las variables con respecto al grado de exposición o movilidad de los vehículos y en el caso de uno de los métodos, también para realizar predicciones con el modelo. Estas técnicas son tres, dos basadas en CART (RPART Y CTREE) y Random Forest. Se dispone de una base de datos con 6,290 millones de registros con 36 variables cada uno pero se van a seleccionar las variables que vayan a aportar información para el estudio, de esta forma se seleccionan: Cilindrada, tara, número de plazas, jefatura de matriculación, potencia, fecha de primera matriculación, año de nacimiento del conductor, fecha ITV y el kilometraje. Previamente al análisis de la base de datos hay que realizar su tratamiento, es decir, la supervisión previa de su contenido y la eliminación de errores, este paso se realiza mediante el software Microsoft Access aplicando los filtros disponibles y posteriormente con las apropiadas líneas de código en el software estadístico R. A la vista de la supervisión se realiza un filtrado exhaustivo y sólo se analizará posteriormente el 2,5% de los registros iniciales, eliminando registros con variables sin información disponible, registros con información incoherente o información de variables permutadas con otras, por lo que el filtrado de la base de datos es una parte importante del proyecto para que los resultados posteriores sean lo más fiables posibles. Al mismo tiempo las variables con formato de fecha se procesan peor por el software R y se generan nuevas variables a partir de las primeras: Km/Año, antigüedad del vehículo, edad del conductor, fecha desde la inspección y renta por provincia, siendo esta última el grupo de C.C.A.A., de los 4 establecidos, al que pertenece la Jefatura de Tráfico en la que se matriculó el vehículo en función de la Renta per Cápita media de sus habitantes. Una vez preparada la base de datos se procede al análisis de la misma mediante dos perspectivas: 1. Análisis por Estadística descriptiva: Se analizan los vehículos a partir de una de sus variables, llegándose en términos generales a las siguientes conclusiones: La distribución de la base de datos se encuentra muy concentrada en los intervalos de las variables siguientes: -Antigüedad entre los 4 y 10 años, -Cilindrada entre 1000 c.c. y 2000 c.c. -Tara entre 1000 kg y 1600 kg. -Potencia entre 40 kW y 120 kW. Los vehículos más nuevos tienen cierta tendencia a menor cilindrada. Al mismo tiempo los vehículos a partir de 11 años son algo más potentes y de mayor cilindrada, reduciéndose esta última y la tara en vehículos a partir de 21 años y aumentando la edad media del conductor. 2. Análisis por técnicas de minería de datos: Se utilizan tres técnicas, las tres para establecer la relevancia de las variables para el grado de exposición o movilidad de los vehículos y Random Forest además para establecer una predicción con el modelo. En cualquier caso, los 3 métodos establecen como la Antigüedad de los vehículos la variable más relevante, es decir, los vehículos más nuevos serían los que tienen mayor grado de exposición o movilidad, realizando más kilómetros por año. En cuanto al resto de variables, los métodos basados en CART establecen como la cilindrada, la tara y por último la edad del conductor como las siguientes variables en relevancia, Random Forest establece la edad del conductor y la renta por provincia como las siguientes variables más importantes. Si se analizan las gráficas de dependencia parcial de cada variable por Random Forest se aprecia que la edad del conductor no es determinante en cuanto al grado de exposición o movilidad de los vehículos hasta la edad de 65 años, donde a partir de ahí desciende la movilidad con una tasa de cambio acusada y negativa, es decir, a mayor edad menor movilidad. En cuanto a la variable renta por provincia, se aprecia como el grupo de mayor renta media ofrece la mayor movilidad por lo que puede deducirse que el factor económico es determinante en cuanto a la movilidad o grado de exposición de los vehículos. Mediante Random Forest es posible realizar predicciones de la movilidad de los vehículos, en términos generales el modelo predice acorde con lo expuesto anteriormente, es decir, los vehículos más nuevos son los que tienen una movilidad mayor y los vehículos cuyos conductores son mayores de 65 años suelen tener una movilidad menor.

More information

Item ID: 44058
DC Identifier: http://oa.upm.es/44058/
OAI Identifier: oai:oa.upm.es:44058
Deposited by: Biblioteca ETSI Industriales
Deposited on: 02 Dec 2016 07:33
Last Modified: 21 Mar 2018 10:32
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM