@unpublished{upm71318, month = {July}, address = {Madrid}, title = {Control de velocidad adaptativo en veh{\'i}culos aut{\'o}nomos conectados mediante aprendizaje por refuerzo}, author = {Javier Cano de la Torre}, year = {2022}, abstract = {La congesti{\'o}n del tr{\'a}fico es un problema constante al que se enfrentan los ciudadanos, causando retrasos y molestias en el desplazamiento, as{\'i} como p{\'e}rdidas econ{\'o}micas a todo aquel que se ve afectado. Las primeras estrategias desarrolladas para mitigar este problema, surgidas en la d{\'e}cada de los ochenta, hac{\'i}an uso de sistemas de se{\~n}alizaci{\'o}n de tiempo fijo. Posteriormente aparecieron algoritmos de control de tiempo variable, utilizando m{\'e}todos estad{\'i}sticos y programaci{\'o}n din{\'a}mica. Gracias a los avances en el {\'a}mbito tecnol{\'o}gico y la inteligencia computacional se han podido implantar sistemas con una optimizaci{\'o}n bioinspirada. La {\'u}ltima tendencia usa el aprendizaje por refuerzo, familia de algoritmos en la que se realiza la optimizaci{\'o}n por prueba y error. En este trabajo se detalla la viabilidad de una soluci{\'o}n optimizando directamente la velocidad de los veh{\'i}culos que se aproximan y circulan por una intersecci{\'o}n no se{\~n}alizada. Por {\'u}ltimo se analizan las dificultades y limitaciones identificadas al aplicar el aprendizaje por refuerzo a este tipo de problemas, as{\'i} como futuras l{\'i}neas de investigaci{\'o}n. Abstract: Traffic congestion is an issue citizens face incessantly, causing delays and inconveniences in commute, besides economic losses to all affected. The first strategies developed to mitigate this problem, which emerged in the 1980s, used fixed-time signaling systems. Later, time-varying control algorithms appeared, using statistical methods and dynamic programming. Advances in technology and computational intelligence have made it possible to implement systems with bio-inspired optimization. The most recent trend uses reinforcement learning, a family of algorithms in which optimization is accomplished by trial and error. This work details the feasibility of a solution by directly optimizing the speed of approaching vehicles traveling through an unsignalized intersection. Lastly, the difficulties and limitations identified when applying reinforcement learning to this type of problem are discussed, as well as future lines of research.}, url = {https://oa.upm.es/71318/}, keywords = {Inteligencia artificial; Aprendizaje por refuerzo; Veh{\'i}culos aut{\'o}nomos; Control del tr{\'a}fico por carretera; Control de velocidad} }