Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española

Bobadilla Sancho, Jesús (1989). Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española. Thesis (Doctoral), Facultad de Informática (UPM).

Description

Title: Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española
Author/s:
  • Bobadilla Sancho, Jesús
Contributor/s:
  • Gómez Vilda, Pedro
Item Type: Thesis (Doctoral)
Date: 1989
Subjects:
Faculty: Facultad de Informática (UPM)
Department: Arquitectura y Tecnología de Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (27MB) | Preview

Abstract

La hipótesis en la que se basa el desarrollo de esta tesis, se centra en la suposición de que partiendo del método de predicción lineal, es posible idear algoritmos de tratamiento de señal que permitan obtener una buena estimación de características espectrales significativas de la voz, especialmente en la detección de los formantes que se producen en el habla. Estos algoritmos ayudarían a construir un catálogo analítico de los principales sonidos del español, con el objetivo de complementar los estudios realizados hasta el momento en el campo de la fonética acústica. Parte de la complejidad que presenta esta tesis doctoral, viene dada por Ja naturaleza multidisciplinar de las materias que aborda. La correcta determinación de diversas características espectrales del habla, requiere un amplio conocimiento de los fundamentos del tratamiento de la señal de voz y de la fonética del idioma escogido. También resulta necesario poseer nociones adecuadas de todas las áreas relacionadas con el tratamiento de Ja voz, con el fin de enfocar los estudios partiendo de una visión global del campo seleccionado. Las investigaciones desarrolladas en este trabajo se han dividido en dos bloques fundamentales: tratamiento de señal y fonética acústica. En el apartado de. tratamiento de señal, se ha validado la hipótesis inicial. La obtención de los formantes del habla se ha basado en el método de predicción lineal, haciéndose una búsqueda de polos fuera de la zona habitual (el círculo unidad). La decisión de trabajar con funciones espectrales suavizadas ha resultado muy adecuada para la estimación de los formantes de voz. Partiendo de estas funciones espectrales se han ideado diferentes etapas que van detectando y resaltando los formantes del habla haciendo uso de transformaciones no lineales basadas en métodos algorítmicos. En el bloque reservado para las investigaciones en fonética acústica española, se aportan mapas tridimensionales de sonidos vocálicos que sirven como modelo para la extensión de las frecuentes clasificaciones bidimensionales que se utilizan en las publicaciones especializadas de fonética acústica. El empleo de una tercera dimensión permite complementar la información tradicional usada en las representaciones vocálicas. Así mismo se aportan trabajos que estudian Ja evolución de Jos formantes en situaciones de coarticulación. Estos trabajos se pueden considerar como una referencia innovadora para el desarrollo de investigaciones más elaboradas que se basen en Jos métodos y herramientas originales empleados en la tesis. En esta tesis se ofrece abundante y variado material en forma de espectros típicos, generalización de la evolución de los formantes, planos de situación de vocales, etc. Estos datos y resultados, junto a la metodología y herramientas informáticas empleados, pueden servir de base para la creación de aplicaciones que actúen sobre distintas áreas del tratamiento de la voz, tales como la enseñanza asistida de idiomas, logopedia, reconocimiento y síntesis del habla, detección de discapacidades, modelizaciones acústicas basadas en la fonética, etc.---ABSTRACT---This thesis is based on the following hypothesis: using the linear prediction method, it is possible to devise signal processing algorithms which obtain a good estimation of significant spectral characteristics of the voice, specially the formants of the speech. These algorithms would help to obtain an analytical catalogue of the main sounds of the Spanish Language, and therefore complement the current studies in the acoustic/phonetics area. Most of the complexity of this doctoral thesis comes from the different subjects covered by the speech processing area. The correct determination of diverse spectral characteristics in the speech, requires a deep knowledge in speech signal processing and the phonetics of the chosen language. In addition, it is necessary to incorporate a suitable background of all the subjects closely connected with speech processing. The research carried out in this work has been classified in two main areas: signal processing and acoustic phonetics. In the signal processing field, the initial hypothesis has been validated. The linear prediction method has been used to get the speech formants, searching the poles outside the usual zone (the unit circle). Working with smoothed spectral functions has been very suitable to fix the speech formants. Starting from these spectral functions, different stages have been developed in order to detect and emphasize the speech formants using nonlinear transformations based on algorithmic methods. With respect to the acoustic phonetics of Spanish, three-dimensional maps of vocalic sounds have been obtained. These maps can serve as a model to extend the two-dimensional classifications used in specialized publications of acoustic phonetics. The third dimension allows to complement the traditional information used in the vocalic representations. The formant evolution in "vowel-consonant-vowel" situations has been studied too. This work may be considered as a reference for future research based on the original methods and tools developed. Finally, abundant and varied material is offered in form of typical time-frequency representations, formant evolutions, two-dimensional and three-dimensional maps of vowels, etc. These data and results, the methodology, and the computing tools developed, can serve as a base to create applications related with different speech processing areas, such as computer assisted language learning, recognition and speech synthesis, acoustic modeling based on the phonetics, etc.

More information

Item ID: 42677
DC Identifier: http://oa.upm.es/42677/
OAI Identifier: oai:oa.upm.es:42677
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 09 Sep 2016 08:22
Last Modified: 09 Sep 2016 08:22
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM