Control de velocidad adaptativo en vehículos autónomos conectados mediante aprendizaje por refuerzo

Cano de la Torre, Javier (2022). Control de velocidad adaptativo en vehículos autónomos conectados mediante aprendizaje por refuerzo. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Control de velocidad adaptativo en vehículos autónomos conectados mediante aprendizaje por refuerzo
Author/s:
  • Cano de la Torre, Javier
Contributor/s:
  • Naranjo Hernández, José Eugenio
  • Serradilla García, Francisco J.
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: July 2022
Subjects:
Freetext Keywords: Inteligencia artificial; Aprendizaje por refuerzo; Vehículos autónomos; Control del tráfico por carretera; Control de velocidad
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)

Abstract

La congestión del tráfico es un problema constante al que se enfrentan los ciudadanos, causando retrasos y molestias en el desplazamiento, así como pérdidas económicas a todo aquel que se ve afectado. Las primeras estrategias desarrolladas para mitigar este problema, surgidas en la década de los ochenta, hacían uso de sistemas de señalización de tiempo fijo. Posteriormente aparecieron algoritmos de control de tiempo variable, utilizando métodos estadísticos y programación dinámica. Gracias a los avances en el ámbito tecnológico y la inteligencia computacional se han podido implantar sistemas con una optimización bioinspirada. La última tendencia usa el aprendizaje por refuerzo, familia de algoritmos en la que se realiza la optimización por prueba y error. En este trabajo se detalla la viabilidad de una solución optimizando directamente la velocidad de los vehículos que se aproximan y circulan por una intersección no señalizada. Por último se analizan las dificultades y limitaciones identificadas al aplicar el aprendizaje por refuerzo a este tipo de problemas, así como futuras líneas de investigación. Abstract: Traffic congestion is an issue citizens face incessantly, causing delays and inconveniences in commute, besides economic losses to all affected. The first strategies developed to mitigate this problem, which emerged in the 1980s, used fixed-time signaling systems. Later, time-varying control algorithms appeared, using statistical methods and dynamic programming. Advances in technology and computational intelligence have made it possible to implement systems with bio-inspired optimization. The most recent trend uses reinforcement learning, a family of algorithms in which optimization is accomplished by trial and error. This work details the feasibility of a solution by directly optimizing the speed of approaching vehicles traveling through an unsignalized intersection. Lastly, the difficulties and limitations identified when applying reinforcement learning to this type of problem are discussed, as well as future lines of research.

More information

Item ID: 71318
DC Identifier: https://oa.upm.es/71318/
OAI Identifier: oai:oa.upm.es:71318
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 20 Jul 2022 19:21
Last Modified: 20 Jul 2022 19:21
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM