Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB) | Preview |
Sánchez Herrero, Ricardo (2018). Desarrollo de una herramienta robusta para la obtención de la movilidad de camiones en base a datos de las inspecciones técnicas de vehículos (ITV) en España. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM), Madrid.
Title: | Desarrollo de una herramienta robusta para la obtención de la movilidad de camiones en base a datos de las inspecciones técnicas de vehículos (ITV) en España |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Final Project |
Degree: | Grado en Ingeniería en Tecnologías Industriales |
Date: | 2018 |
Subjects: | |
Faculty: | E.T.S.I. Industriales (UPM) |
Department: | Ingeniería Mecánica |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB) | Preview |
La seguridad vial es uno de los temas candentes en nuestro país. Gran cantidad de accidentes de tráfico que tienen lugar en las carreteras españolas se debe a fallos técnicos detectados en los vehículos involucrados. El mecanismo oficial del que se dispone para asegurar que los vehículos se encuentran en condiciones óptimas de circulación son las inspecciones ITV, realizadas con cierta frecuencia en las estaciones ITV homologadas para tal fin.En un archivo proporcionado por la DGT, disponemos una gran cantidad de registros de todos los camiones en circulación por el territorio español durante los últimos años y, a raíz de este archivo, nos proponemos seguir una serie de pautas para extraer conclusiones en base a la movilidad del colectivo, entendiendo la movilidad como la cantidad de kilómetros recorridos anualmente.El volumen inicial de datos contenido en el archivo es muy grande y, tras una primera lectura, se han detectado numerosos casos que contienen errores de anotación (u otro tipo) y por lo tanto será necesario desarrollar una etapa de depuración con el fin de obtener una base de datos apta para proceder con el siguiente estudio. Esta etapa de depuración, pese a no haber sido considerada como uno de los objetivos principales del proyecto, ha sido sin duda clave para que el posterior desarrollo ofrezca resultados precisos y de carácter general. El proceso seguido a partir de aquí no ha seguido un orden cronológico normal, pues durante las siguientes etapas de análisis se detectaron nuevos errores, lo que nos obligó a empezar desde cero y rehacer varias veces la etapa de depuración. La tarea más importante de la etapa de depuración consiste en definir una serie de criterios que permitan “limpiar” los registros que entorpecen el muestreo y aplicar correctamente los algoritmos de programación necesarios para llevarlos a cabo.
Estos criterios seleccionados se presentan a continuación, según su orden de aplicación: C0 Supresión de las variables que, debido a la información contenida en ellas, contengan un alto número de datos considerados “no válidos”. O directamente, variables que no se consideran relevantes. C1
Contar únicamente con los registros cuya clave de inspección sea “favorable”. Ya que cualquier otro contenido en esta variable implica que dicho registro fue considerado erróneo debido a que el vehículo contenía algún tipo de error y, que por tanto, debió someterse a revisión de nuevo para repetir la inspección. C2 Con este criterio trataremos de asegurarnos que los registros que quedan en la base de datos depurada pertenecen únicamente a vehículos cuyo dato en la variable referente al tipo de vehículo se corresponde con alguno de los tipos de camiones. C3 Prescindir de los registros que no dispongan de ningún dato en la variable KM, o que dicho dato sea 0. Surge debido a la necesidad posterior de estudiar la movilidad de los camiones, la cual obviamente depende de los km recorridos. C4 Observar los rangos admisibles para ciertas variables involucradas en el estudio de la movilidad y definir, en base a unos catálogos de referencia, una serie de valores a partir de los cuales los datos disponibles se consideren erróneos. C5 A pesar de haber eliminado con el criterio 0 las variables con un exceso de registros “no válidos”, todavía existen variables que contienen gran número de ellos en alguno de los registros. Es por tanto necesario realizar una observación más profunda de los distintos casos y comprobar los posibles errores de lectura para su corrección. C6 Gracias una nueva variable generada (EDAD_ITV), podemos conocer exactamente la edad que tenía el vehículo a su paso por la ITV. Su signo negativo informará de que la fecha de inspección es previa a la de matriculación del propio vehículo. C7 El tiempo transcurrido entre inspecciones debe ser siempre positivo. Los casos en que se obtienen valores negativos en dicha variable, o valores muy pequeños, indican que las inspecciones no están ordenadas o que alguna de ellas tuvo que ser repetida en un período corto de tiempo. C8 Definimos una nueva variable que se encarga de medir la variación de kilómetros recorridos entre inspecciones consecutivas. El que aparezca un número negativo en esta columna nos alertará de nuevos casos de error. Además impondremos un límite que localice aquellos casos extraños de circulación excesiva. Posteriormente, se ha decidido realizar un estudio estadístico con el fin de obtener conclusiones sobre la distribución de los datos para cada una de las variables disponibles. Esto nos ayudó a poder elaborar sub grupos que clasifican la muestra en función de unas ciertas características: como podía ser antigüedad del vehículo para poder clasificar los vehículos según su época de matriculación, o los tipos de camión existentes y los valores más típicos de prestaciones de cada uno de ellos para poder sub clasificarlos en grupos según sus prestaciones más importantes. El gran número de camiones (6013) y la gran cantidad de tipos de camión (15) contenidos en esta base de datos ya depurada, hace que los rangos de estas variables sean altísimos y que las conclusiones extraídas sean únicamente teóricas para un número casos. Gracias a la exploración de la muestra a través de ciertas funciones y la correspondiente representación en forma de gráficos, también podemos analizar comportamientos multi variables y estudiar la correlación existente entre las variables implicadas.
Para el estudio de la movilidad se han tenido en cuenta técnicas de minería de datos, útiles a la hora de trabajar con grandes volúmenes de información (en cuanto a cantidad de registros y número de variables implicadas). Estas técnicas nos permiten: - Relacionar unas variables de entrada (supuestamente independientes) con una variable de salida (variable respuesta, dependiente).- Proporcionar una jerarquía de importancia de cara a la afectación de cada una de estas variables sobre la variable dependiente.- Generar unos modelos de regresión en función de la correlación existente entre las variables. La cantidad de kilómetros recorridos anualmente es por tanto dependiente en gran medida de todas estas variables, siguiendo en algunos casos patrones de comportamiento predecible en función de aquellas. El Barómetro general de movilidad propuesto en este proyecto, nos permite observar la estimación de ciertos vehículos para los cuales seleccionamos las características más importantes. Uno de los problemas surgidos en este estudio predictivo es el error que se genera, el cual en gran medida es debido a los altos valores de las variables temporales. Así mismo, en la elección aleatoria de los vehículos seleccionados (E1, E2, ... , E6) para generar este Barómetro, se han tenido en cuenta únicamente ciertas características, pero no se ha considerado en ningún caso el tipo de vehículo del que se trata. Esto provoca que el modelo no contenga una variable que considere en la predicción el servicio al que el camión se dedica, induciendo mayor incertidumbre. De cara a reducir este error y a proporcionar un Barómetro mucho más sensible, se ofrece la posibilidad añadir una nueva variable, capaz de seleccionar un tipo específico de camión sobre el que aplicar el estudio predictivo. En nuestro caso, hemos elegido representar lo que ocurre con el tipo el 1F, correspondiente a los camiones contra incendios. Se podrá comprobar también como la horquilla de error (para un intervalo de +-30% de error) incluye ahora un gran número de registros (70%), provocando que la fiabilidad del estudio aumente.
Item ID: | 49661 |
---|---|
DC Identifier: | https://oa.upm.es/49661/ |
OAI Identifier: | oai:oa.upm.es:49661 |
Deposited by: | Biblioteca ETSI Industriales |
Deposited on: | 13 Mar 2018 14:37 |
Last Modified: | 13 Mar 2018 14:42 |