Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española

Bobadilla Sancho, Jesús ORCID: https://orcid.org/0000-0003-0619-1322 (1989). Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española. Thesis (Doctoral), Facultad de Informática (UPM). https://doi.org/10.20868/UPM.thesis.42677.

Description

Title: Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española
Author/s:
Contributor/s:
Item Type: Thesis (Doctoral)
Read date: 1989
Subjects:
Faculty: Facultad de Informática (UPM)
Department: Arquitectura y Tecnología de Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TD_BOBADILLA_SANCHO_JESUS.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (27MB) | Preview

Abstract

La hipótesis en la que se basa el desarrollo de esta tesis, se centra en la suposición de que partiendo del
método de predicción lineal, es posible idear algoritmos de tratamiento de señal que permitan obtener una
buena estimación de características espectrales significativas de la voz, especialmente en la detección de
los formantes que se producen en el habla. Estos algoritmos ayudarían a construir un catálogo analítico de
los principales sonidos del español, con el objetivo de complementar los estudios realizados hasta el
momento en el campo de la fonética acústica.
Parte de la complejidad que presenta esta tesis doctoral, viene dada por Ja naturaleza multidisciplinar de
las materias que aborda. La correcta determinación de diversas características espectrales del habla,
requiere un amplio conocimiento de los fundamentos del tratamiento de la señal de voz y de la fonética
del idioma escogido. También resulta necesario poseer nociones adecuadas de todas las áreas relacionadas
con el tratamiento de Ja voz, con el fin de enfocar los estudios partiendo de una visión global del campo
seleccionado.
Las investigaciones desarrolladas en este trabajo se han dividido en dos bloques fundamentales:
tratamiento de señal y fonética acústica. En el apartado de. tratamiento de señal, se ha validado la hipótesis
inicial. La obtención de los formantes del habla se ha basado en el método de predicción lineal,
haciéndose una búsqueda de polos fuera de la zona habitual (el círculo unidad). La decisión de trabajar
con funciones espectrales suavizadas ha resultado muy adecuada para la estimación de los formantes de
voz. Partiendo de estas funciones espectrales se han ideado diferentes etapas que van detectando y
resaltando los formantes del habla haciendo uso de transformaciones no lineales basadas en métodos
algorítmicos.
En el bloque reservado para las investigaciones en fonética acústica española, se aportan mapas
tridimensionales de sonidos vocálicos que sirven como modelo para la extensión de las frecuentes
clasificaciones bidimensionales que se utilizan en las publicaciones especializadas de fonética acústica. El
empleo de una tercera dimensión permite complementar la información tradicional usada en las
representaciones vocálicas. Así mismo se aportan trabajos que estudian Ja evolución de Jos formantes en
situaciones de coarticulación. Estos trabajos se pueden considerar como una referencia innovadora para el
desarrollo de investigaciones más elaboradas que se basen en Jos métodos y herramientas originales
empleados en la tesis.
En esta tesis se ofrece abundante y variado material en forma de espectros típicos, generalización de la
evolución de los formantes, planos de situación de vocales, etc. Estos datos y resultados, junto a la
metodología y herramientas informáticas empleados, pueden servir de base para la creación de
aplicaciones que actúen sobre distintas áreas del tratamiento de la voz, tales como la enseñanza asistida de
idiomas, logopedia, reconocimiento y síntesis del habla, detección de discapacidades, modelizaciones
acústicas basadas en la fonética, etc.---ABSTRACT---This thesis is based on the following hypothesis: using the linear prediction method, it is possible to
devise signal processing algorithms which obtain a good estimation of significant spectral characteristics
of the voice, specially the formants of the speech. These algorithms would help to obtain an analytical
catalogue of the main sounds of the Spanish Language, and therefore complement the current studies in
the acoustic/phonetics area.
Most of the complexity of this doctoral thesis comes from the different subjects covered by the speech
processing area. The correct determination of diverse spectral characteristics in the speech, requires a
deep knowledge in speech signal processing and the phonetics of the chosen language. In addition, it is
necessary to incorporate a suitable background of all the subjects closely connected with speech
processing.
The research carried out in this work has been classified in two main areas: signal processing and acoustic
phonetics. In the signal processing field, the initial hypothesis has been validated. The linear prediction
method has been used to get the speech formants, searching the poles outside the usual zone (the unit
circle). Working with smoothed spectral functions has been very suitable to fix the speech formants.
Starting from these spectral functions, different stages have been developed in order to detect and
emphasize the speech formants using nonlinear transformations based on algorithmic methods.
With respect to the acoustic phonetics of Spanish, three-dimensional maps of vocalic sounds have been
obtained. These maps can serve as a model to extend the two-dimensional classifications used in
specialized publications of acoustic phonetics. The third dimension allows to complement the traditional
information used in the vocalic representations. The formant evolution in "vowel-consonant-vowel"
situations has been studied too. This work may be considered as a reference for future research based on
the original methods and tools developed.
Finally, abundant and varied material is offered in form of typical time-frequency representations, formant
evolutions, two-dimensional and three-dimensional maps of vowels, etc. These data and results, the
methodology, and the computing tools developed, can serve as a base to create applications related with
different speech processing areas, such as computer assisted language learning, recognition and speech
synthesis, acoustic modeling based on the phonetics, etc.

More information

Item ID: 42677
DC Identifier: https://oa.upm.es/42677/
OAI Identifier: oai:oa.upm.es:42677
DOI: 10.20868/UPM.thesis.42677
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 09 Sep 2016 08:22
Last Modified: 10 Oct 2022 09:23
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM