Clasificación de géneros musicales a partir del audio con Deep Learning

Galindo Santos, Juan Francisco (2019). Clasificación de géneros musicales a partir del audio con Deep Learning. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Clasificación de géneros musicales a partir del audio con Deep Learning
Author/s:
  • Galindo Santos, Juan Francisco
Contributor/s:
  • Mozo Velasco, Alberto
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: July 2019
Subjects:
Freetext Keywords: Géneros musicales; Audio
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB)
[img] Archive (ZIP) - Users in campus UPM only
Download (149kB)

Abstract

En este proyecto se exploran las diferentes técnicas y recursos disponibles para el análisis de audio con la finalidad de realizar una clasificación de canciones en función de su género musical. Se parte con la estructuración de un dataset con el que realizar el entrenamiento. Ya que no existen muchos conjuntos de datos para estos propósitos, se obtienen canciones representativas a partir de APIs de artistas independientes y datasets ya formados. A continuación, estos datos se equilibran en relación a los ejemplos por género y se pasa a obtener sus espectrogramas como medida de extracción de características para su posterior análisis. Con los datasets realizados, se exploran diferentes técnicas de Deep Learning como modelos para el aprendizaje de patrones. En concreto, se realizan entrenamientos con redes CNN y redes LSTM, teniendo un número de parámetros similar para cada una. Se emplean técnicas para mejorar la generalización en Deep Learning, como el dropout. Una vez el entrenamiento ha completado, se comparan tanto los tiempos de aprendizaje como las métricas obtenidas en sus entrenamientos. A partir de estos dos modelos, se realizan comparativas en las métricas que se obtienen en el dataset de test. Con la realización de tres experimentos diferentes, se contemplan las posibilidades y aplicaciones de cada uno. Además, se explica el significado de los resultados y la razón por la que uno de los modelos obtiene mejores métricas, llegando a superar el 85% de aciertos de media en sus clasificaciones en 7 géneros musicales como categorías. Abstract: In this project, the different techniques and resources available for audio analysis are explored in order to classify songs according to their musical genre. It starts with the structuring of a dataset with which to carry out the training. Since there are not many data sets for these purposes, representative songs are obtained from the APIs of independent artists and datasets already formed. Then, these data are balanced in relation to the examples by genre and their spectrograms are obtained as a measure of feature extraction for further analysis. With the datasets made, different Deep Learning techniques are explored as models for learning patterns. In particular, training is carried out with CNN and LSTM networks, having a similar number of parameters for each one. Techniques are used to improve the generalization in Deep Learning, such as dropout. Once the training has been completed, both the learning times and the metrics obtained in their workouts are compared. From these two models, comparisons are made in the metrics obtained in the test dataset. With the realization of three different experiments, the possibilities and applications of each one are contemplated. In addition, the meaning of the results and the reason why one of the models obtains better metrics are explained, reaching over 85% of correct answers in their classifications in 7 musical genres as categories.

More information

Item ID: 56390
DC Identifier: http://oa.upm.es/56390/
OAI Identifier: oai:oa.upm.es:56390
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 11 Sep 2019 12:52
Last Modified: 11 Sep 2019 14:19
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM