Research on reinforcement learning methods: a practical study

Pinilla Martínez, Fernando Javier (2017). Research on reinforcement learning methods: a practical study. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Research on reinforcement learning methods: a practical study
Author/s:
  • Pinilla Martínez, Fernando Javier
Contributor/s:
  • Bajo Pérez, Javier
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2017
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (476kB) | Preview

Abstract

El aprendizaje por refuerzo ha mejorado significativamente en las últimas décadas, haciendo importantes contribuciones a una amplia gama de campos en Inteligencia Artificial. Mientras que la investigación en este campo ha crecido considerablemente, algunos de los proyectos más impactantes han demostrado la eficacia de las metodologías y los principios del aprendizaje por refuerzo cuando se combinan con otros métodos como las cada vez más importantes redes neuronales artificiales. Un ejemplo de esto es la codificación de un agente de inteligencia artificial que logra resultados sobrehumanos en diferentes tareas como juego de mesa o visión por computador. El objetivo principal de este proyecto es adquirir un conocimiento y comprensión profundos acerca de las ventajas y desventajas del aprendizaje por refuerzo en contraste con otros campos comunes en aprendizaje automático como el aprendizaje supervisado y el aprendizaje no supervisado. El presente proyecto estudia el aprendizaje por refuerzo a partir de sus principios básicos y presenta algunos de los métodos y algoritmos más avanzados. Una implementación de un algoritmo de aprendizaje de refuerzo es llevada a cabo para resolver un simple problema de encontrar las mejores acciones en el juego de mesa Tic-Tac-Toe, utilizando uno de los algoritmos más relevantes en la materia llamado Q-Learning. Se presentan otras características interesantes sobre el aprendizaje por refuerzo junto con las principales líneas abiertas de investigación que se están estudiando actualmente.---ABSTRACT---Reinforcement learning has improved significantly over the past decades, making important contributions to a wide range of fields in Artificial Intelligence. While research on this field has grown considerably big, some of the most impacting projects have proven the efficiency of reinforcement learning methodologies and principles when combined with other methods like the emerging artificial neural networks. One example of this is the coding of an Artificial Intelligence agent that achieves superhuman results on different tasks like board game playing or computer vision. The main objective of this project is to acquire a deep knowledge and understanding of the advantages and disadvantages of reinforcement learning in contrast to other common fields of machine learning such as supervised learning and unsupervised learning. This project studies reinforcement learning from its core principles and presents some of the state-of-the-art methods and algorithms. An implementation of a reinforcement learning algorithm is conducted to solve a simple problem of finding the best actions in the board game Tic-Tac-Toe, using one of the most relevant algorithms, Q-Learning. Other interesting features about reinforcement learning are presented along with the main open lines of research that are currently being studied.

More information

Item ID: 47887
DC Identifier: http://oa.upm.es/47887/
OAI Identifier: oai:oa.upm.es:47887
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 28 Sep 2017 06:43
Last Modified: 28 Sep 2017 06:43
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM