Reconocedor automático de patrones musicales

Fuentes Méndez, Miguel (2020). Reconocedor automático de patrones musicales. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. y Sistemas de Telecomunicación (UPM).

Description

Title: Reconocedor automático de patrones musicales
Author/s:
  • Fuentes Méndez, Miguel
Contributor/s:
  • Gutiérrez Arriola, Juana María
Item Type: Final Project
Degree: Grado en Ingeniería de Sonido e Imagen
Date: 13 October 2020
Subjects:
Faculty: E.T.S.I. y Sistemas de Telecomunicación (UPM)
Department: Ingeniería Telemática y Electrónica
Creative Commons Licenses: None

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (14MB) | Preview

Abstract

La música es una parte importante de nuestras vidas, nos acompaña durante nuestros días haciendo de banda sonora; sin embargo, son muchas las ocasiones en las que nos resulta difícil acordarnos del título de una canción que conocemos. Los algoritmos de reconocimiento automático de canciones funcionan bajo esta premisa, identificar la pieza completa teniendo un pequeño fragmento de la misma. Shazam es la aplicación más popular que realiza esta función y uno de sus creadores, Avery Li-Chun Wang, explica las bases del algoritmo en el paper An Industrial-strength audio search algorithm, publicación sobre la que se sustenta este proyecto. En el paper de Wang no se detallan las claves del algoritmo, por ello, se pretende desarrollar un prototipo de reconocedor automático de patrones musicales completando la información aportada en la publicación. Este prototipo ha de ser capaz de reconocer un fragmento de audio de unos pocos segundos e identificarlo con su correspondiente canción en una base de datos, si es que se encuentra dentro de ella. Para poder llevarlo a cabo se implementa un algoritmo capaz de extraer las características espectrales más importantes del fragmento y compararlas con las del resto de canciones. El prototipo tiene que ser rápido para poder funcionar con fluidez y presentar cierta robustez frente al ruido, identificando correctamente un fragmento cuya grabación se realiza con un ruido añadido ajeno a la canción original. Además, se completa el prototipo con el desarrollo de una aplicación sencilla que permita al usuario identificar una canción en tiempo real y en pocos pasos. Paralelamente, se estudia la adaptación del algoritmo a la identificación de fragmentos tarareados y silbados. Gracias al desarrollo de este prototipo, se completa la información proporcionada en el paper de Wang con una alternativa que seguramente no sea la utilizada por Shazam pero que consigue el objetivo de un sistema reconocedor automático de patrones musicales.

More information

Item ID: 66037
DC Identifier: http://oa.upm.es/66037/
OAI Identifier: oai:oa.upm.es:66037
Deposited by: Miguel Fuentes
Deposited on: 03 Feb 2021 11:12
Last Modified: 03 Feb 2021 11:12
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM