Diseño e implementación de una funcionalidad de Transfer Learning en un modelo de aprendizaje por refuerzo aplicado a la navegación con drones

López Guillén, Juan (2020). Diseño e implementación de una funcionalidad de Transfer Learning en un modelo de aprendizaje por refuerzo aplicado a la navegación con drones. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Diseño e implementación de una funcionalidad de Transfer Learning en un modelo de aprendizaje por refuerzo aplicado a la navegación con drones
Author/s:
  • López Guillén, Juan
Contributor/s:
  • Barreiro Sorrivas, José María
  • Lara Torralbo, Juan Alfonso
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: September 2020
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview

Abstract

Este trabajo trata de diseñar, desarrollar e implementar una funcionalidad de Transfer Learning en un modelo de aprendizaje por refuerzo. El trabajo parte de un entorno simulado ya desarrollado, en el que se aplican técnicas de aprendizaje por refuerzo para la navegación de drones con capacidad de direccionamiento automático y anticolisión de los drones con otros drones y con diferentes tipos de obstáculos fijos. Uno de los objetivos fundamentales del sistema ya desarrollado, es tener la capacidad de utilizar el aprendizaje adquirido en entornos diferentes a aquel en el que se ha desarrollado el aprendizaje. Para ello, se quiere mejorar el sistema dotándolo de una funcionalidad de transferencia de aprendizaje (Transfer Learning), que permita estudiar en qué escenarios y en qué condiciones es posible transferir el aprendizaje y con qué nivel de calidad. El objetivo principal de este trabajo es continuar con el trabajo de los proyectos anteriores, y desarrollar el diseño y la implementación de un módulo dentro del sistema existente que permita exportar el conocimiento adquirido durante una simulación en un entorno concreto y poder importarlo en otros entornos para poder medir el grado de transferibilidad del aprendizaje.---ABSTRACT---We are trying to design, develop and implement a Transfer Learning functionality, in this case we are going to implement it in a dron and airplane flight simulation software, although during the work we will focus on the simulation with drones. The functionality will be implemented on Ancas, a simulator of planes and drones, whose objective is automatic learning to take the best way to get from a starting point to an end point given its coordinates. It is composed of two programs: the creator of the simulation (configuration of parameters, number of agents, obstacles present, etc.), called SimLander, and the visualization of the simulation, called Lander. The objective of this work is to continue with the work of the previous projects, and to implement the Transfer Learning functionality so that each time we carry out a simulation we do not start from a base of null knowledge, and that we can therefore improve the times and results of the tests.

More information

Item ID: 64769
DC Identifier: http://oa.upm.es/64769/
OAI Identifier: oai:oa.upm.es:64769
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 19 Oct 2020 09:22
Last Modified: 19 Oct 2020 09:22
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM