Modelado de fuente glotal para extraer características de la identidad del locutor

Madrid Lara, Álvaro (2015). Modelado de fuente glotal para extraer características de la identidad del locutor. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S.I. y Sistemas de Telecomunicación (UPM), Madrid.

Descripción

Título:	Modelado de fuente glotal para extraer características de la identidad del locutor
Autor/es:	Madrid Lara, Álvaro
Director/es:	Gutiérrez Arriola, Juana María https://orcid.org/0000-0003-0888-6582
Tipo de Documento:	Trabajo Fin de Grado o Proyecto Fin de Carrera
Fecha:	16 Septiembre 2015
Materias:	Informática
ODS:	09. Industria, innovación e infraestructura
Escuela:	E.T.S.I. y Sistemas de Telecomunicación (UPM)
Departamento:	Teoría de la Señal y Comunicaciones
Licencias Creative Commons:	Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of PFC_ALVARO_MADRID_LARA.pdf]

Vista Previa

PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (3MB) | Vista Previa

Resumen

La producción de la voz humana se lleva a cabo en el tracto vocal. Los sintetizadores consiguen emular a las distintas partes del tracto vocal, y gracias a ellos se pueden modificar características propias del hablante. Una de estas modificaciones consiste variar el tono de un locutor inicial, mezclando parámetros de éste con los de un locutor deseado.
En este proyecto se ha desarrollado un modelo propuesto para este cambio de identidad. Partiendo de las señales de voz originales se han extraído parámetros para crear una base de datos para cada locutor. Las voces se sintetizarán mezclando estas bases de datos y otros parámetros correspondientes a distintos locutores dando como resultado una señal de voz con características de dos locutores diferentes.
Finalmente se realizarán pruebas auditivas para comprobar la identidad del locutor de la voz sintetizada.
ABSTRACT.
Human voice production is carried out in the vocal tract. Each part of the vocal tract is emulated in synthesizers, and for that, speaker features can be modified. One of these modifications is to change the initial speaker tone, mixing parameters of this speaker with the parameters of a desired speaker. In this project it has been developed a proposed model for this identity change. Starting from the originals voice signals its parameters have been extracted to built a database for each speaker. Voices will be synthesized mixing these databases with parameters of the others speakers giving as result a voice signal with features of two different speakers. Finally, hearing tests will be made to check the speaker identity of the synthesized voice.

Más información

ID de Registro:	39931
Identificador DC:	https://oa.upm.es/39931/
Identificador OAI:	oai:oa.upm.es:39931
Depositado por:	Biblioteca Universitaria Campus Sur
Depositado el:	14 Abr 2016 10:09
Ultima Modificación:	14 Abr 2016 10:09

Estadísticas

Exportar cita

Editar (sólo personal del Archivo)

En esta página

Menú principal

Buscar

Modelado de fuente glotal para extraer características de la identidad del locutor

Cita

Descripción

Texto completo

Resumen

Más información

Acciones

Documentos

El repositorio

Agrupados por ...

Datos Investigación

Financiadores

Especiales

En otros formatos

Redes sociales

Información adicional