Modelo para la determinación de la exposición de los vehículos, a partir de los datos registrados en ITV, teniendo en cuenta sus características y antigüedad

Recio Viejo, José Ángel (2016). Modelo para la determinación de la exposición de los vehículos, a partir de los datos registrados en ITV, teniendo en cuenta sus características y antigüedad. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Descripción

Título: Modelo para la determinación de la exposición de los vehículos, a partir de los datos registrados en ITV, teniendo en cuenta sus características y antigüedad
Autor/es:
  • Recio Viejo, José Ángel
Director/es:
  • Arenas Ramírez, Blanca
  • Mira McWilliams, Jose Manuel
Tipo de Documento: Proyecto Fin de Carrera/Grado
Fecha: 2016
Materias:
Palabras Clave Informales: CART,RPART, CTREE, Random Forest, minería de datos, estadística descriptiva, filtrado, movilidad o exposición, modelo , predicción.
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Ingeniería Mecánica
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) | Vista Previa

Resumen

Todos los países desarrollados aplican políticas de gestión del tráfico y Seguridad Vial, estas deben ir acorde según de los avances en la tecnología y la evolución social. Una de las vías para el desarrollo de estas políticas es conocer patrones de comportamiento y establecer niveles de riesgo para los distintos tipos de vehículos, para ello es necesario conocer los niveles de exposición de forma desagregada. Dentro de los distintos tipos de vehículos existe el colectivo de los Turismos que representa el 69,6% de las víctimas y el 52,2% de los fallecidos en accidentes de tráfico, por eso la importancia de conocer especialmente los patrones de la exposición de estos en las carreteras, de ahí que este proyecto se centre en este colectivo. El objetivo fundamental es determinar un modelo de la exposición de los vehículos turismos, desarrollando la metodología y herramientas para ello. Para el desarrollo del proyecto se utilizan técnicas de Minería de datos dado el volumen de datos a manejar, para establecer el grado de relevancia de las variables con respecto al grado de exposición o movilidad de los vehículos y en el caso de uno de los métodos, también para realizar predicciones con el modelo. Estas técnicas son tres, dos basadas en CART (RPART Y CTREE) y Random Forest. Se dispone de una base de datos con 6,290 millones de registros con 36 variables cada uno pero se van a seleccionar las variables que vayan a aportar información para el estudio, de esta forma se seleccionan: Cilindrada, tara, número de plazas, jefatura de matriculación, potencia, fecha de primera matriculación, año de nacimiento del conductor, fecha ITV y el kilometraje. Previamente al análisis de la base de datos hay que realizar su tratamiento, es decir, la supervisión previa de su contenido y la eliminación de errores, este paso se realiza mediante el software Microsoft Access aplicando los filtros disponibles y posteriormente con las apropiadas líneas de código en el software estadístico R. A la vista de la supervisión se realiza un filtrado exhaustivo y sólo se analizará posteriormente el 2,5% de los registros iniciales, eliminando registros con variables sin información disponible, registros con información incoherente o información de variables permutadas con otras, por lo que el filtrado de la base de datos es una parte importante del proyecto para que los resultados posteriores sean lo más fiables posibles. Al mismo tiempo las variables con formato de fecha se procesan peor por el software R y se generan nuevas variables a partir de las primeras: Km/Año, antigüedad del vehículo, edad del conductor, fecha desde la inspección y renta por provincia, siendo esta última el grupo de C.C.A.A., de los 4 establecidos, al que pertenece la Jefatura de Tráfico en la que se matriculó el vehículo en función de la Renta per Cápita media de sus habitantes. Una vez preparada la base de datos se procede al análisis de la misma mediante dos perspectivas: 1. Análisis por Estadística descriptiva: Se analizan los vehículos a partir de una de sus variables, llegándose en términos generales a las siguientes conclusiones: La distribución de la base de datos se encuentra muy concentrada en los intervalos de las variables siguientes: -Antigüedad entre los 4 y 10 años, -Cilindrada entre 1000 c.c. y 2000 c.c. -Tara entre 1000 kg y 1600 kg. -Potencia entre 40 kW y 120 kW. Los vehículos más nuevos tienen cierta tendencia a menor cilindrada. Al mismo tiempo los vehículos a partir de 11 años son algo más potentes y de mayor cilindrada, reduciéndose esta última y la tara en vehículos a partir de 21 años y aumentando la edad media del conductor. 2. Análisis por técnicas de minería de datos: Se utilizan tres técnicas, las tres para establecer la relevancia de las variables para el grado de exposición o movilidad de los vehículos y Random Forest además para establecer una predicción con el modelo. En cualquier caso, los 3 métodos establecen como la Antigüedad de los vehículos la variable más relevante, es decir, los vehículos más nuevos serían los que tienen mayor grado de exposición o movilidad, realizando más kilómetros por año. En cuanto al resto de variables, los métodos basados en CART establecen como la cilindrada, la tara y por último la edad del conductor como las siguientes variables en relevancia, Random Forest establece la edad del conductor y la renta por provincia como las siguientes variables más importantes. Si se analizan las gráficas de dependencia parcial de cada variable por Random Forest se aprecia que la edad del conductor no es determinante en cuanto al grado de exposición o movilidad de los vehículos hasta la edad de 65 años, donde a partir de ahí desciende la movilidad con una tasa de cambio acusada y negativa, es decir, a mayor edad menor movilidad. En cuanto a la variable renta por provincia, se aprecia como el grupo de mayor renta media ofrece la mayor movilidad por lo que puede deducirse que el factor económico es determinante en cuanto a la movilidad o grado de exposición de los vehículos. Mediante Random Forest es posible realizar predicciones de la movilidad de los vehículos, en términos generales el modelo predice acorde con lo expuesto anteriormente, es decir, los vehículos más nuevos son los que tienen una movilidad mayor y los vehículos cuyos conductores son mayores de 65 años suelen tener una movilidad menor.

Más información

ID de Registro: 44058
Identificador DC: http://oa.upm.es/44058/
Identificador OAI: oai:oa.upm.es:44058
Depositado por: Biblioteca ETSI Industriales
Depositado el: 02 Dic 2016 07:33
Ultima Modificación: 02 Dic 2016 07:33
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM