Generación automática de música mediante tecnologías de aprendizaje profundo

García Torrecilla, Juan Carlos (2018). Generación automática de música mediante tecnologías de aprendizaje profundo. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Descripción

Título: Generación automática de música mediante tecnologías de aprendizaje profundo
Autor/es:
  • García Torrecilla, Juan Carlos
Director/es:
  • Serrano Fernández, Emilio
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería Informática
Fecha: Enero 2018
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (4MB) | Vista Previa

Resumen

Este trabajo presenta el desarrollo de un modelo capaz de generar y completar composiciones musicales de forma automática mediante algoritmos generativos de aprendizaje automático, como son las redes neur onales recurrentes. A lo largo del documento se estudian y comparan diferentes estructuras de red neuronal –principalmente estructuras recurrentes y estructuras que implementan células de memoria, debido a sus notables resultados –, y se discute la represen tación de los datos de entrada, así como los aspectos de diseño para la creación de un modelo capaz de generar composiciones. El documento también presenta el diseño e implementación de una interfaz web que de acceso a este servicio. Se trata pues, de una herramienta para asistir a creativos y artistas, tanto profesionales como aficionados, en el proceso creativo. Si bien ya existen proyectos que tratan de componer música procesada como texto, ninguno realiza un preproceso sobre los datos de entrada. Esto i mplica que la red debe aprender la sintaxis del código al completo, la cual contiene múltiples términos dependientes entre sí, siendo dichos términos en ocasiones muy distantes. El aprendizaje de toda esta sintaxis conlleva un entrenamiento muy intenso, lo que produce sobreajuste ( overfitting ) en muchos casos. Habitualmente , si se detiene el entrenamiento antes del overfitting , no se produce código sint ácticamente correcto. Y s i se alcanza una sintaxis correcta, se produce overfitting . Para solventar este p roblema, se realiza un preproceso de datos que elimina las dependencias más complejas. Además, se toman las notas (“=A,”, “~”, “=b”...) como elementos temporales, en lugar de las símbolos (“=”, “A”, “b”...). Así, el contenido musical se abstrae de la sintaxis. Como resultado de esto, la salida de la red devolverá probabilidades para cada nota, y no para cada símbolo . Lo cual nos permite implementar una nueva funcionalidad que genere diferentes composiciones con los mismos datos de entrada. Esta funcionalidad selecciona la nota aleatoriamente en base a la distribuci ón de probabilidad dada ( como si de un dado ponderado se tratase ). Así, se provee al modelo de un factor creativo del que carecen el resto de modelos. A todo esto se le suma una interfaz web para faci litar el uso de la herramienta y ponerla al alcance de usuarios sin conocimientos técnicos . En los resultados y evaluaciones de este proyecto se presta especial atención a la detección de overfitting , puesto que uno de los objetivos esenciales que persigue este proyecto es la generación de contenido creativo. Por ende, completamente nuevo. A la finalización de este proyecto, los resultados alcanzan el 37% de exactitud en el conjunto de validación, sin que se produzca sobreajuste en el modelo.---ABSTRACT---ix Abstract This work presents the development of a model capable of generating and completing musical compositions automatically through generative algorithms of machine learning, such as recurrent neural networks. Throughout the document different neuronal network structures –mainly recurrent structures and structures that implement memory cells, due to their remarkable results – are studied and compared, and the representation of the input data is discussed, as well as the design aspects for the creation of a model capable of generating compositions. The document also presents the design and implementation of a web interface to access this service. It is therefore a tool to assist creatives and artists, both professionals and amateurs, in the creative process. While there are already projects that try to compose music processed as text, none performs a preprocess on the input data. This implies that the network must learn the syntax of the code completely which contains multiple terms that depend on each other, these terms being sometimes very distant. Learning all this syntax involves a very intense training, which produces overfitting in many cases. Usually, if training is stopped before overfitting, syntactically correct code is not produced. And if a correct syntax is reached, overfitting occurs. To solve this problem, a preprocessing of data is carried out that eliminates the most complex dependencies. In addition, notes (“=A,”, “~”, “=b ”...) are taken as temporary elements, instead of symbols (“=”, “A”, “b”... ). Thus, the musical content is abstracted from the syntax. As a result of this, the output of the network will return probabilities for each note, and not for each symbol. Which allows us to implement a new functionality that generates different compositions with the same input data. This functionality selects the note randomly based on the given probability distribution (like a weighted dice). Thus, the model is provided with a creative factor that the other models lack. To all this we add a web interface to faci litate the use of the tool and make it available to users without technical knowledge. In the results and evaluations of this project, special attention is paid to the overfitting detection , since one of the essential objectives pursued by this project is the generation of creative content. Therefore, completely new. On finishing this project , the results reach 37% accuracy in the validation set, without overfitting the model.

Más información

ID de Registro: 49682
Identificador DC: http://oa.upm.es/49682/
Identificador OAI: oai:oa.upm.es:49682
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 12 Mar 2018 08:33
Ultima Modificación: 12 Mar 2018 08:33
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM