Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview |
Ayas Ferrer, María Rosa (2019). Análisis estadístico de los accidentes ciclistas en España mediante el modelo de serie temporal jerárquica agrupada. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).
Title: | Análisis estadístico de los accidentes ciclistas en España mediante el modelo de serie temporal jerárquica agrupada |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Final Project |
Degree: | Grado en Ingeniería en Tecnologías Industriales |
Date: | June 2019 |
Subjects: | |
Faculty: | E.T.S.I. Industriales (UPM) |
Department: | Ingeniería de Organización, Administración de Empresas y Estadística |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview |
Los accidentes de tráfico con víctimas ciclistas son uno de los problemas viales más importantes del momento en España y un tema muy actual en las noticias. Por ello, este proyecto se centra en estudiar, mediante el programa estadístico R, cómo ha evolucionado el número de víctimas de estos vehículos desde 1999 hasta 2017 y qué factores intervienen en esta variación. Otro de los objetivos del proyecto es establecer un modelo de predicción para la evolución del número de víctimas para este tipo de accidentes en los próximos cinco años, desde 2018 hasta 2022. Los datos utilizados para llevar a cabo este análisis han sido extraídos de las tablas estadísticas anuales publicadas por la Dirección General de Tráfico en su página web. Se tomarán las tablas desde el año 1999 hasta 2017. El siguiente paso consiste en preparar los datos de forma que todos se encuentren en el mismo formato y hacer una selección de los datos de interés para el proyecto, que facilite su posterior análisis. Esta preparación consiste en agrupar los datos en forma de variables del tipo data.frame según los atributos que se quieren analizar. Una vez efectuada está preparación de los datos, estos se estudiarán mediante dos tipos de análisis llevados a cabo en RStudio: - Análisis estático: Este primer análisis consiste en un estudio de la información disponible de la situación actual de los accidentes de ciclistas en España. En primer lugar, mediante el paquete ggplot2 perteneciente a R, se efectúa un análisis inicial representando gráficamente la información presente en los datos de las tablas de la DGT desde 1999 hasta 2017. Aquí se podrá comprobar que, efectivamente como aparece en los medios, ha habido un aumento de las víctimas ciclistas y cuál es la gravedad, el sexo y las franjas de edad de estas o el tipo de vía en el que se comenten los accidentes: interurbana o urbana. A continuación, se realiza un análisis de la varianza de un diseño de experimentos de tres factores. Mediante la tabla ANOVA se puede observar qué factores tienen un efecto significativo en el número de víctimas y también los efectos de las interacciones entre ellos. Los tres factores seleccionados para el estudio de este proyecto han sido: el tipo de víctima según la gravedad del accidente (fallecido, herido grave y herido leve), el sexo de la víctima (hombre o mujer) y el tipo de vía en la que sucedió el accidente (interurbana o urbana). Los resultados obtenidos muestran que los tres factores son significativos, de forma que hay grandes variaciones en los grupos dentro de ellos. Así, el grupo con mayores posibilidades de sufrir un accidente es para herido leve, hombre en vía urbana. La única interacción entre factores cuyo efecto no es despreciable respecto al número de víctimas, es la existente entre el tipo de víctima y el tipo de vía. Esta interacción se puede entender como que en vías interurbanas la gravedad de los accidentes es mayor que en el caso de vías urbanas a pesar de que el número de víctimas en interurbanas sea menor. Análisis dinámico: El objeto de este análisis es tratar la información como una serie temporal de datos anuales. Por la estructura de la información, se eligió el modelo de una serie temporal jerárquica agrupada, en la que el número total de víctimas se puede disgregar según los grupos de los tres factores del análisis de la varianza anterior: - Tipo → Fallecido (FA), Herido Grave (HG) y Herido Leve (HL) - Sexo → Hombre (H) y Mujer (M) - Vía → Interurbana (I) y Urbana (U) Estos grupos se encuentran cruzados entre ellos en distintos niveles y dan lugar a distintas estructuras según el orden que se elija, pero siempre se llega a las mismas series base, independientemente del camino que se siga. Esta serie jerárquica agrupada tiene tres niveles que están dispuestos en 36 subseries. Posteriormente, de los métodos existentes para realizar una predicción en este tipo de series, se estudian el método Bottom-up y el método de Combinación Óptima, evaluando su precisión de pronóstico mediante los errores MAPE y MASE que cometen. Para ello, se toman como datos de entrenamiento los datos entre 1999 y 2012 y se realiza una predicción mediante ambos métodos para el dato de 2013. A continuación, se compara el dato estimado con el dato real de 2013 y se evalúan los errores MAPE y MASE cometidos por ambos métodos. Repitiendo este procedimiento para los datos de los años 2014, 2015, 2016 y 2017 y comparando los errores MAPE y MASE de cada uno, se llega a la conclusión de que el método de Combinación Óptima tiene una exactitud un poco mayor que el método Bottom-up y menores errores MAPE y MASE de pronóstico. Por último, se aplica el modelo de predicción mediante el método de Combinación Óptima a la serie temporal jerárquica agrupada “Total de víctimas” para estimar cómo evolucionará en los próximos cinco años y también cada una de las 36 series que forman parte de esta estructura.
Item ID: | 55977 |
---|---|
DC Identifier: | https://oa.upm.es/55977/ |
OAI Identifier: | oai:oa.upm.es:55977 |
Deposited by: | Biblioteca ETSI Industriales |
Deposited on: | 07 Aug 2019 10:44 |
Last Modified: | 29 Sep 2019 22:30 |