Sistema de recluta de audio para bases de datos de voz

Santos Calzada, Antonio (2009). Sistema de recluta de audio para bases de datos de voz. Proyecto Fin de Carrera / Trabajo Fin de Grado, Facultad de Informática (UPM).

Description

Title: Sistema de recluta de audio para bases de datos de voz
Author/s:
  • Santos Calzada, Antonio
Contributor/s:
  • Martínez Olalla, Rafael
Item Type: Final Project
Date: 2009
Subjects:
Faculty: Facultad de Informática (UPM)
Department: Arquitectura y Tecnología de Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

En este documento se presenta una aplicación llamada Sesión de Grabación, desarrollada con el fin específico de permitir realizar el proceso de recluta de audio para la creación de bases de datos de voz. Las bases de datos de voces procedentes de distintos tipos de locutores, resultan de gran ayuda en el desarrollo de sistemas de reconocimiento automático de voz, al ser una base de estudio que, según sus características como género, edad, patologías o idiomas de los locutores, permitirán realizar reconocedores tanto de propósito específico como general. La aplicación Sesión de Grabación permitirá capturar y clasificar de forma automática las voces de los locutores participantes, de forma sencilla y pudiendo ser utilizada por un solo usuario. Esta aplicación surge como una evolución de los métodos anteriores usados para el mismo fin. En el tercer capítulo de este documento se describe el estado del arte, información básica para entender los aspectos que influyen en el tratamiento de audio digital, específicamente en el sistema operativo Windows. En el capítulo 4 se hablará del proyecto Hesperia en el que se encuadra la presente aplicación. En los capítulos 5, 6 y 7, se tratará de forma más directa la aplicación, explicando sus funcionalidades, y entrando en detalles de diseño e implementación. Finalmente en el capítulo 8 se comentarán ciertas formas en las que podría evolucionar Sesión de Grabación en un futuro cercano. ABSTRACT In this document a new application called “Sesión de Grabación” will be showed and explained in detail. The aim of it is being able to capture audio for the creation of databases for voice. The databases containing voices from different kind of speakers are of great aid for the development of automatic voice recognition systems. Depending on the characteristics of the speakers, such as their idiom, gender, age or pathology, these databases can become the base of study for both general and specific purpose voice recognizers. The application “Sesión de Grabación” allows the user to automatically capture and classify the voice of the participant speakers, in an easy way and only needing one user to control it. This is an evolution of previous and less efficient methods for the same purpose. On the third chapter in this document it is described the state of the art, some basic information needed to understand the aspects that affect the digital audio management, with some details being specific for the Windows operating system. On chapter 4, I will talk about the Hesperia project, in which this application is contained. On chapters 5, 6 and 7, the application “Sesión de Grabación” will be explained more specifically, showing its functionalities and the design and development aspects. Finally on chapter 8, some of the future possible evolutions and improvements for the application will be discussed.

More information

Item ID: 1615
DC Identifier: http://oa.upm.es/1615/
OAI Identifier: oai:oa.upm.es:1615
Deposited by: Archivo Digital UPM
Deposited on: 22 May 2009
Last Modified: 20 Apr 2016 06:54
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM