Citation
López Guillén, Juan
(2020).
Diseño e implementación de una funcionalidad de Transfer Learning en un modelo de aprendizaje por refuerzo aplicado a la navegación con drones.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.
Abstract
Este trabajo trata de diseñar, desarrollar e implementar una funcionalidad de Transfer Learning en un modelo de aprendizaje por refuerzo. El trabajo parte de un entorno simulado ya desarrollado, en el que se aplican técnicas de aprendizaje por refuerzo para la navegación de drones con capacidad de direccionamiento automático y anticolisión de los drones con otros drones y con diferentes tipos de obstáculos fijos. Uno de los objetivos fundamentales del sistema ya desarrollado, es tener la capacidad de utilizar el aprendizaje adquirido en entornos diferentes a aquel en el que se ha desarrollado el aprendizaje. Para ello, se quiere mejorar el sistema dotándolo de una funcionalidad de transferencia de aprendizaje (Transfer Learning), que permita estudiar en qué escenarios y en qué condiciones es posible transferir el aprendizaje y con qué nivel de calidad. El objetivo principal de este trabajo es continuar con el trabajo de los proyectos anteriores, y desarrollar el diseño y la implementación de un módulo dentro del sistema existente que permita exportar el conocimiento adquirido durante una simulación en un entorno concreto y poder importarlo en otros entornos para poder medir el grado de transferibilidad del aprendizaje.---ABSTRACT---We are trying to design, develop and implement a Transfer Learning functionality, in this case we are going to implement it in a dron and airplane flight simulation software, although during the work we will focus on the simulation with drones. The functionality will be implemented on Ancas, a simulator of planes and drones, whose objective is automatic learning to take the best way to get from a starting point to an end point given its coordinates. It is composed of two programs: the creator of the simulation (configuration of parameters, number of agents, obstacles present, etc.), called SimLander, and the visualization of the simulation, called Lander. The objective of this work is to continue with the work of the previous projects, and to implement the Transfer Learning functionality so that each time we carry out a simulation we do not start from a base of null knowledge, and that we can therefore improve the times and results of the tests.