Desarrollo de una aplicación software para la detección en tiempo real de un evento acústico

Paniagua Santamaría, Arturo (2021). Desarrollo de una aplicación software para la detección en tiempo real de un evento acústico. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. y Sistemas de Telecomunicación (UPM), Madrid.

Description

Title: Desarrollo de una aplicación software para la detección en tiempo real de un evento acústico
Author/s:
  • Paniagua Santamaría, Arturo
Contributor/s:
  • Fraile Muñoz, Rubén
  • Rodríguez Ortega, Miguel
Item Type: Final Project
Degree: Grado en Ingeniería de Sistemas de Telecomunicación
Date: January 2021
Subjects:
Freetext Keywords: Acústica
Faculty: E.T.S.I. y Sistemas de Telecomunicación (UPM)
Department: Ingeniería Telemática y Electrónica
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only until 13 March 2022 - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (871kB)
[img] Archive (ZIP) - Users in campus UPM only
Download (82kB)

Abstract

En la actualidad, existe un gran interés por conocer y clasificar los eventos acústicos que nos rodean en nuestro día a día, desde el habla hasta los generados en nuestro entorno. Como consecuencia el análisis computacional de las escenas auditivas (CASA, Computational Auditory Scene Analysis), o el reconocimiento del habla humana (ASR, Automatic Speech Recognition), han conseguido una gran notoriedad en la investigación, en especial la detección y clasificación de eventos acústicos, así como su correspondiente localización espacial dentro de los sistemas CASA. La detección de eventos acústicos tiene como objetivo la clasificación de los mismos entre un abanico de posibilidades conocidas previamente, así como la identificación de su comienzo y final sin ningún tipo de contexto temporal. En el presente proyecto tiene como objetivo el desarrollo de una aplicación software para la detección en tiempo real de un evento acústico, utilizando Python como lenguaje de programación y como algoritmo clasificador una red neuronal perceptrón multicapa con filtros sinápticos FIR (FIR – MLP, Finit Impulse Response Multilayer Perceptron) entrenado con el algoritmo temporal backpropagation. Previamente, a la clasificación en tiempo real se ha entrenado la red neuronal, con el objetivo de encontrar su configuración óptima. La red neuronal ha sido alimentada para llevar a cabo dicho entrenamiento, con un base de datos desarrollada específicamente para el presente proyecto. El proyecto consta de tres fases: la extracción de características de la base de datos de audios, el entrenamiento de la red neuronal y por último la clasificación en tiempo real. Tal y como se ha podido observar tras los resultados obtenidos durante el proyecto, la solución propuesta sirve para abordar el problema de la detección de eventos acústicos en tiempo real, evaluándose con un conjunto de datos desarrollado exclusivamente para el proyecto llevado a cabo. Abstract: Nowadays, there is a great interest in knowing and classifying the acoustic events that surround us in our daily lives, from speech to those generated in the environment in which we live. As a consequence, the computational analysis of auditory scenes (CASA, Computational Auditory Scene Analysis), as well as the recognition of human speech (ASR, Automatic Speech Recognition), have achieved great notoriety in research, especially the arrest and classification of acoustic events , as well as the location of acoustic events within the CASA systems. The objective of detecting acoustic events is the classification of said acoustic events among a range of previously known possibilities, as well as the identification of their beginning and end without any type of temporal context. The objective of this project is the development of a software application for the real-time detection of an acoustic event, using Python as a programming language, using a multilayer perceptron with FIR synaptic filters (FIR - MLP, Finit Impulse Response as classifier algorithm). Multilayer Perceptron) trained with the temporal backpropagation algorithm. Before classifying in real time, the neural network has been trained to find its optimal configuration. The neural network has been fed, to accomplish said training, with a database developed specifically for this project. The project consists of three phases: the extraction of characteristics from the audio database, the training of the neural network and finally the classification in real time. As can be seen after the results obtained during the project, the proposed solution serves to resolve the problem of detecting acoustic events in real time, evaluating it with a data set developed exclusively for the project carried out.

More information

Item ID: 69447
DC Identifier: https://oa.upm.es/69447/
OAI Identifier: oai:oa.upm.es:69447
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 13 Jan 2022 16:03
Last Modified: 13 Jan 2022 16:03
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM