Acrobot: control de robots subactuados usando métodos de aprendizaje automático

Mier Muñoz, Gonzalo (2017). Acrobot: control de robots subactuados usando métodos de aprendizaje automático. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Acrobot: control de robots subactuados usando métodos de aprendizaje automático
Author/s:
  • Mier Muñoz, Gonzalo
Contributor/s:
  • Lope de Asiaín, Javier de
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2017
Subjects:
Freetext Keywords: Acrobot; Algoritmo Genético; Aprendizaje por Refuerzo; Control; Inteligencia Artificial; LQR; PD; PWM; SARSA; Robot subactuado; Genetic Algorithm; Reinforcement Learning; Artificial Inteligence; Underactuated robotic arm
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview

Abstract

Un acrobot es un robot planar subactuado con un actuador pasivo en la primera articulación. El problema de control de este sistema es ser capaz de llevarlo desde la posición de reposo hasta la posición de péndulo invertido. Para ello, se suele dividir el problema de control en dos, el "swing-up problem", donde el acrobot tiene que ganar altura balanceándose como haría un acróbata humano, y el "balancing problem", donde el acrobot tiene que ser capaz de permanecer en la posición de péndulo invertido. Para este trabajo, se han desarrollado diferentes controladores que resuelven el problema de control del acrobot usando técnicas de Inteligencia Artificial. Para el "swing-up problem", se han desarrollado dos controladores PD y un controlador basado en SARSA y otro en <Lambda>-SARSA. Para el "balancing problem", se ha desarrollado un controlador LQR. Por último, se ha desarrollado un nuevo controlador basado en un PWM para solucionar el problema completo. Los controladores SARSA y <Lambda>-SARSA son capaces de resolver el problema de mantenimiento aprendiendo por el método de prueba-error, mientras que los otros controladores han sido ajustados con un algoritmo genético.---ABSTRACT---An acrobot is formed by a double pendulum whose first joint is not actuated. The main purpose of this system is to make it rise from the rest position to the inverted pendulum position. This control problem can be divided in the swing-up problem, when the robot has to rise itself through swinging up as a human acrobat does, and the balancing problem, when the robot has to maintain itself on the inverted pendulum position. We have developed some controllers that uses Artificial Intelligence techniques to solve those problem. Two types of PD controllers and one which is based on SARSA and on <Lambda>-SARSA have been used to control the acrobot on the swing-up problem. For the balancing problem, we have used a LQR controller. Finally, to solve the whole problem with one controller, we have proposed a new controller based on a PWM. All the controllers except SARSA and <Lambda>-SARSA are tuned with a Genetic Algorithm.

More information

Item ID: 47905
DC Identifier: http://oa.upm.es/47905/
OAI Identifier: oai:oa.upm.es:47905
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 02 Oct 2017 06:56
Last Modified: 02 Oct 2017 06:56
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM