Software de procesado de audio en tiempo real

Estecha Garitagoitia, Marcos Santiago (2018). Software de procesado de audio en tiempo real. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. y Sistemas de Telecomunicación (UPM), Madrid.

Description

Title: Software de procesado de audio en tiempo real
Author/s:
  • Estecha Garitagoitia, Marcos Santiago
Contributor/s:
  • Fraile Muñoz, Rubén
Item Type: Final Project
Degree: Grado en Ingeniería de Sonido e Imagen
Date: 27 July 2018
Subjects:
Freetext Keywords: Eventos acústicos
Faculty: E.T.S.I. y Sistemas de Telecomunicación (UPM)
Department: Teoría de la Señal y Comunicaciones
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview
[img] Archive (ZIP) (Anexos) - Users in campus UPM only
Download (757kB)

Abstract

La detección automática de eventos sonoros, también denominada detección de eventos acústicos tiene como objetivo el procesar la señal acústica en tiempo continuo y extraer de ella descriptores que puedan dar lugar a una representación simbólica del correspondiente evento sonoro que la haya producido. Este procedimiento puede ser aplicado a una gran variedad de ámbitos; la gestión y clasificación de bases de datos multimedia de los eventos según el contexto, la monitorización no intrusiva para disponer de una atención médica más eficaz o dar soporte a servicios de control y vigilancia. Este proyecto está basado en el concepto de que los eventos sonoros son buenos elementos descriptivos de la escena acústica en tanto en cuanto permiten describir e interpretar actividades sociales y humanas. Estos eventos acústicos pueden representar y llegar a caracterizar un ambiente específico. Por ejemplo, una escena acústica de una calle bulliciosa en la que se suceden eventos como el paso de los coches, sirenas o pisadas de los peatones. Esta escena acústica puede ser descrita a distintos niveles según los elementos descriptivos que intervengan representando el contexto general (la calle) y los demás eventos sonoros característicos (coches, sirenas y pasos). La intención del presente trabajo se encuadra en un ámbito más específico, dentro de otro de mayor alcance cuyo propósito general es el de la detección de eventos acústicos en tiempo real. El interés de este proyecto es el de crear un software programado en lenguaje de alto nivel, capaz de procesar el audio en tiempo real. El objetivo particularmente es tomar este software desarrollado como base y evolucionarlo, incorporando en futuras líneas de desarrollo mejoras y nuevas funcionalidades hasta alcanzar el objetivo general. Así pues, este proyecto se ha encargado del desarrollo de un software con interfaz gráfica que permite la captura, procesado y visualización de señales de audio, así como de otras capacidades como son detección de nivel, grabación, almacenamiento y recuperación desde fichero etc. Para ello, se ha hecho uso de las tecnologías actuales para el desarrollo de aplicaciones de alto nivel en Windows como sistema operativo: el entorno de desarrollo integrado de Microsoft Visual Studio, el lenguaje de programación C++ y el framework MFC como infraestructura visual. La implementación de la aplicación se ha hecho, atendiendo a las restricciones del diseño, utilizando un ordenador personal de propósito general y la documentación pertinente. Finalmente, se ha podido comprobar cómo sin experiencia previa de programación en Visual C++ y en un plazo de poco más de 6 meses, se ha conseguido la primera versión de una aplicación gráfica, estable y de fácil uso para la evaluación y procesado de audio. Abstract: Automatic sound events detection, also known as acoustic events detection, aims to process the acoustic signal in a continuous timeline and extract from it descriptors. These descriptors can represent in a symbolic way the sound event that has caused it. This procedure can be applied in diverse situations: management tasks for multimedia databases of the events, unobtrusive monitoring to provide a better health-care or support for surveillance and security services. This project is based on the idea that sound events are good enough descriptor of the acoustic scene – as in being able to describe and understanding human and social activities. These acoustic events can even characterize a whole set up. As an example, an acoustic scene of a transited street where different events are going on such as the cars passing by, car horns or the stepping sound of the pedestrians. This scene can indeed be described throughout different levels by the descriptive elements that take place, representing the general context (the street) and the rest of the characteristic sound events (the cars, horns and footsteps). The purpose of this work is framed in a more specific ambit within other with a larger scope which general mission is to detect sound events in real time. Thus, the goal of this work is to create a software coded in high-level language that can process audio in real time. The focus is specifically on taking this solution as a baseline software and keep improving it, adding in future developments improvements and new functionalities until the final goal is met. Therefore, this project has consisted in developing a software with a GUI that allows the capture, processing and visualization of audio signals. It also portrays additional features such as level detection, recording, storing and retrieval from file, etc. The tools of choice have been the ones used on Windows as an OS to develop high-level software. These are Microsoft Visual Studio, C++ as the coding language and the MFC framework for the GUI. To comply with the constraints imposed, the developing of the application has been carried on in a general-purpose PC and resorting to the relevant documentation when needed. Finally, it is worth to mention how with no previous experience of coding in Visual C++ and in a timeframe of merely 6 months, the first version of an audio-processing application has been developed. The result has proven to be stable and user-friendly.

More information

Item ID: 54087
DC Identifier: http://oa.upm.es/54087/
OAI Identifier: oai:oa.upm.es:54087
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 25 Feb 2019 07:52
Last Modified: 26 Feb 2019 13:28
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM