Research on reinforcement learning methods: a practical study

Pinilla Martínez, Fernando Javier (2017). Research on reinforcement learning methods: a practical study. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título: Research on reinforcement learning methods: a practical study
Autor/es:
  • Pinilla Martínez, Fernando Javier
Director/es:
  • Bajo Pérez, Javier
Tipo de Documento: Tesis (Master)
Título del máster: Inteligencia Artificial
Fecha: Julio 2017
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (476kB) | Vista Previa

Resumen

El aprendizaje por refuerzo ha mejorado significativamente en las últimas décadas, haciendo importantes contribuciones a una amplia gama de campos en Inteligencia Artificial. Mientras que la investigación en este campo ha crecido considerablemente, algunos de los proyectos más impactantes han demostrado la eficacia de las metodologías y los principios del aprendizaje por refuerzo cuando se combinan con otros métodos como las cada vez más importantes redes neuronales artificiales. Un ejemplo de esto es la codificación de un agente de inteligencia artificial que logra resultados sobrehumanos en diferentes tareas como juego de mesa o visión por computador. El objetivo principal de este proyecto es adquirir un conocimiento y comprensión profundos acerca de las ventajas y desventajas del aprendizaje por refuerzo en contraste con otros campos comunes en aprendizaje automático como el aprendizaje supervisado y el aprendizaje no supervisado. El presente proyecto estudia el aprendizaje por refuerzo a partir de sus principios básicos y presenta algunos de los métodos y algoritmos más avanzados. Una implementación de un algoritmo de aprendizaje de refuerzo es llevada a cabo para resolver un simple problema de encontrar las mejores acciones en el juego de mesa Tic-Tac-Toe, utilizando uno de los algoritmos más relevantes en la materia llamado Q-Learning. Se presentan otras características interesantes sobre el aprendizaje por refuerzo junto con las principales líneas abiertas de investigación que se están estudiando actualmente.---ABSTRACT---Reinforcement learning has improved significantly over the past decades, making important contributions to a wide range of fields in Artificial Intelligence. While research on this field has grown considerably big, some of the most impacting projects have proven the efficiency of reinforcement learning methodologies and principles when combined with other methods like the emerging artificial neural networks. One example of this is the coding of an Artificial Intelligence agent that achieves superhuman results on different tasks like board game playing or computer vision. The main objective of this project is to acquire a deep knowledge and understanding of the advantages and disadvantages of reinforcement learning in contrast to other common fields of machine learning such as supervised learning and unsupervised learning. This project studies reinforcement learning from its core principles and presents some of the state-of-the-art methods and algorithms. An implementation of a reinforcement learning algorithm is conducted to solve a simple problem of finding the best actions in the board game Tic-Tac-Toe, using one of the most relevant algorithms, Q-Learning. Other interesting features about reinforcement learning are presented along with the main open lines of research that are currently being studied.

Más información

ID de Registro: 47887
Identificador DC: http://oa.upm.es/47887/
Identificador OAI: oai:oa.upm.es:47887
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 28 Sep 2017 06:43
Ultima Modificación: 28 Sep 2017 06:43
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM