Desarrollo de una herramienta de análisis de la señal de voz

Monzón Alonso, Javier (2016). Desarrollo de una herramienta de análisis de la señal de voz. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S.I. y Sistemas de Telecomunicación (UPM), Madrid.

Descripción

Título:	Desarrollo de una herramienta de análisis de la señal de voz
Autor/es:	Monzón Alonso, Javier
Director/es:	Gutiérrez Arriola, Juana María https://orcid.org/0000-0003-0888-6582
Tipo de Documento:	Trabajo Fin de Grado o Proyecto Fin de Carrera
Fecha:	5 Febrero 2016
Materias:	Informática
ODS:	04. Educación de calidad 09. Industria, innovación e infraestructura
Escuela:	E.T.S.I. y Sistemas de Telecomunicación (UPM)
Departamento:	Teoría de la Señal y Comunicaciones
Licencias Creative Commons:	Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_JAVIER_MONZON_ALONSO.pdf]

Vista Previa

PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) | Vista Previa

Resumen

El habla es la principal herramienta de comunicación de la que dispone el ser humano que, no sólo le permite expresar su pensamiento y sus sentimientos sino que le distingue como individuo.
El análisis de la señal de voz es fundamental para múltiples aplicaciones como pueden ser: síntesis y reconocimiento de habla, codificación, detección de patologías, identificación y reconocimiento de locutor… En el mercado se pueden encontrar herramientas comerciales o de libre distribución para realizar esta tarea.
El objetivo de este Proyecto Fin de Grado es reunir varios algoritmos de análisis de la señal de voz en una única herramienta que se manejará a través de un entorno gráfico. Los algoritmos están siendo utilizados en el Grupo de investigación en Aplicaciones MultiMedia y Acústica de la Universidad Politécnica de Madrid para llevar a cabo su tarea investigadora y para ofertar talleres formativos a los alumnos de grado de la Escuela Técnica Superior de Ingeniería y Sistemas de Telecomunicación.
Actualmente se ha encontrado alguna dificultad para poder aplicar los algoritmos ya que se han ido desarrollando a lo largo de varios años, por distintas personas y en distintos entornos de programación.
Se han adaptado los programas existentes para generar una única herramienta en MATLAB que permite:
. Detección de voz
. Detección sordo/sonoro
. Extracción y revisión manual de frecuencia fundamental de los sonidos sonoros
. Extracción y revisión manual de formantes de los sonidos sonoros
En todos los casos el usuario puede ajustar los parámetros de análisis y se ha mantenido y, en algunos casos, ampliado la funcionalidad de los algoritmos existentes.
Los resultados del análisis se pueden manejar directamente en la aplicación o guardarse en un fichero.
Por último se ha escrito el manual de usuario de la aplicación y se ha generado una aplicación independiente que puede instalarse y ejecutarse aunque no se disponga del software o de la versión adecuada de MATLAB.
ABSTRACT.
The speech is the main communication tool which has the human that as well as allowing to express his thoughts and feelings distinguishes him as an individual.
The analysis of speech signal is essential for multiple applications such as: synthesis and recognition of speech, coding, detection of pathologies, identification and speaker recognition… In the market you can find commercial or open source tools to perform this task.
The aim of this Final Degree Project is collect several algorithms of speech signal analysis in a single tool which will be managed through a graphical environment. These algorithms are being used in the research group Aplicaciones MultiMedia y Acústica at the Universidad Politécnica de Madrid to carry out its research work and to offer training workshops for students at the Escuela Técnica Superior de Ingeniería y Sistemas de Telecomunicación.
Currently some difficulty has been found to be able to apply the algorithms as they have been developing over several years, by different people and in different programming environments.
Existing programs have been adapted to generate a single tool in MATLAB that allows:
. Voice Detection
. Voice/Unvoice Detection
. Extraction and manual review of fundamental frequency of voiced sounds
. Extraction and manual review formant voiced sounds
In all cases the user can adjust the scan settings, we have maintained and in some cases expanded the functionality of existing algorithms.
The analysis results can be managed directly in the application or saved to a file.
Finally we have written the application user’s manual and it has generated a standalone application that can be installed and run although the user does not have MATLAB software or the appropriate version.

Más información

ID de Registro:	40605
Identificador DC:	https://oa.upm.es/40605/
Identificador OAI:	oai:oa.upm.es:40605
Depositado por:	Biblioteca Universitaria Campus Sur
Depositado el:	31 May 2016 10:10
Ultima Modificación:	31 May 2016 10:10

Estadísticas

Exportar cita

Editar (sólo personal del Archivo)

En esta página

Menú principal

Buscar

Desarrollo de una herramienta de análisis de la señal de voz

Cita

Descripción

Texto completo

Resumen

Más información

Acciones

Documentos

El repositorio

Agrupados por ...

Datos Investigación

Financiadores

Especiales

En otros formatos

Redes sociales

Información adicional