Predicción de la movilidad entre provincias de España a partir del histórico de datos del ministerio

Fariñas Nubla, Alejandro (2021). Predicción de la movilidad entre provincias de España a partir del histórico de datos del ministerio. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Description

Title: Predicción de la movilidad entre provincias de España a partir del histórico de datos del ministerio
Author/s:
  • Fariñas Nubla, Alejandro
Contributor/s:
  • Garrido Martínez-Llop, Pablo
Item Type: Final Project
Degree: Grado en Ingeniería en Tecnologías Industriales
Date: July 2021
Subjects:
Freetext Keywords: Aprendizaje automático, Inteligencia Artificial, Redes neuronales, Predicción, Movilidad poblacional, Transporte
Faculty: E.T.S.I. Industriales (UPM)
Department: Matemática Aplicada a la Ingeniería Industrial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview

Abstract

En los últimos años, el aumento de la población ha dado lugar a un incremento de la información y datos asociados a la movilidad de las personas. Sin embargo, la gran cantidad de datos que se generan a diario no serían de utilidad si no fuera por el empleo de herramientas como el “Big Data” o el “Machine Learning”, las cuales permiten el procesamiento de esas grandes cantidades de datos generados y obtener conclusiones de interés de la información. El “Machine Learning” es una rama de la inteligencia artificial, en la que las máquinas son capaces de aprender a resolver una tarea sin ser expresamente programadas para ella, en base al reconocimiento de patrones. De entre los tipos de algoritmos de aprendizaje automático que existen, se encuentran las “redes neuronales artificiales”, algoritmo que imita la disposición de las neuronas en el cerebro para procesar información entrante. Su funcionamiento se basa en el “aprendizaje supervisado” comparando las salidas generadas, con los datos verdaderos, aprendiendo en cada iteración con el fin de minimizar el error de la predicción mediante la modificación de los pesos ponderados que procesan la información entrante. La aplicación de la inteligencia artificial en este Trabajo de Fin de Grado (TFG) tiene el fin de resolver un problema de regresión, en donde la intención es predecir una variable concreta de forma continua, y no realizar una clasificación en distintas categorías. El objetivo de este TFG es el diseño e implementación de un modelo predictivo basado en redes neuronales que permita predecir los desplazamientos poblacionales en España. Con la predicción precisa de los desplazamientos de la población, se podría lograr una optimización de los recursos, con un mejor ajuste de los servicios de transporte a la demanda generada, la eliminación de rutas poco frecuentadas y la planificación de nuevas infraestructuras de transporte. La optimización de la movilidad en un país es esencial de cara a cumplir los objetivos ambientales fijados por la ONU, en la Agenda 2030. Una mejor planificación de rutas y frecuencias de servicios de transporte público permitiría la optimización de costes y reducción de las emisiones generadas. Al ofrecer a los usuarios una mejor oferta de transporte público, se daría opción de abandonar sus vehículos privados como opción preferente, contribuyendo a la descarbonización del transporte. Los datos empleados en este trabajo son ofrecidos por el Ministerio de Transportes, Movilidad y Agenda Urbana. Se trata de registros anonimizados de la actividad móvil de 13 millones de líneas, escaladas al número total de la población nacional. Contienen desde febrero de 2020 hasta abril de 2021 comprendiendo toda la evolución de la pandemia COVID-19. Estos datos requieren de un preprocesamiento previo para su correcto tratamiento previo y agrupación en bases de datos menores. Tras un análisis estadístico detallado de los datos se realiza la división de los datos en dos modelos, uno con los desplazamientos entre provincias (interprovincial) y otro con los desplazamientos realizados dentro de la provincia (intraprovincial). El modelo principal que se desarrollará en este proyecto es el interprovincial, por el mayor interés que presenta la predicción de desplazamientos entre provincias (predecir los movimientos masivos de la población, evaluar la implementación de grandes infraestructuras de transporte público entre provincias, evaluar la comunicación de las provincias con los principales núcleos poblacionales del país). En segundo lugar, con objeto de comprobar la validez del modelo óptimo interprovincial obtenido, comprobaremos la idoneidad de este modelo para el problema de desplazamientos intraprovinciales. La creación del modelo predictivo atraviesa numerosas etapas, empezando por la decisión de los datos a emplear en el modelo, el correcto funcionamiento de la red neuronal y la búsqueda de la configuración óptima que permita el mejor rendimiento en la generación de predicciones Tras obtener resultados satisfactorios sobre el desempeño de la red, se analizaron las distintas opciones de combinaciones de orígenes y destinos, concluyendo que lo más eficiente es el procesamiento de trayectos con un origen y destino únicos. Esto permitirá al algoritmo un mejor ajuste al comportamiento de las personas desplazadas y realizar mejores predicciones. Se probará el desempeño de la red neuronal creada sobre varias rutas centradas en la provincia de Madrid como referencia, con varias rutas complementarias de otras provincias para modelizar el comportamiento general de país en cuanto a desplazamientos interprovinciales. Tras el entrenamiento del modelo de red neuronal con los datos de las rutas usadas de ejemplo, se valora su desempeño principalmente con, el error generado entre la predicción y el dato verdadero (MAPE), la dispersión de los datos medidos con la raíz del error cuadrático medio partido de la media de desplazados (error de desviación), que nos permite comparar la desviación de los datos según el volumen de desplazados en esa ruta, y el ajuste del modelo a los datos (R2). Tras el análisis estadístico, creación de los modelos de red neuronal y obtención de resultados, se llega a una serie de conclusiones en este proyecto

More information

Item ID: 68563
DC Identifier: https://oa.upm.es/68563/
OAI Identifier: oai:oa.upm.es:68563
Deposited by: Biblioteca ETSI Industriales
Deposited on: 03 Nov 2021 06:05
Last Modified: 29 Dec 2021 23:30
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM