Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española

Bobadilla Sancho, Jesús (1989). Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española. Tesis (Doctoral), Facultad de Informática (UPM) [antigua denominación].

Descripción

Título: Desarrollo de algoritmos basados en filtrado adaptativo y su aplicación en el estudio de la fonética acústica española
Autor/es:
  • Bobadilla Sancho, Jesús
Director/es:
  • Gómez Vilda, Pedro
Tipo de Documento: Tesis (Doctoral)
Fecha: 1989
Materias:
Escuela: Facultad de Informática (UPM) [antigua denominación]
Departamento: Arquitectura y Tecnología de Sistemas Informáticos
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (27MB) | Vista Previa

Resumen

La hipótesis en la que se basa el desarrollo de esta tesis, se centra en la suposición de que partiendo del método de predicción lineal, es posible idear algoritmos de tratamiento de señal que permitan obtener una buena estimación de características espectrales significativas de la voz, especialmente en la detección de los formantes que se producen en el habla. Estos algoritmos ayudarían a construir un catálogo analítico de los principales sonidos del español, con el objetivo de complementar los estudios realizados hasta el momento en el campo de la fonética acústica. Parte de la complejidad que presenta esta tesis doctoral, viene dada por Ja naturaleza multidisciplinar de las materias que aborda. La correcta determinación de diversas características espectrales del habla, requiere un amplio conocimiento de los fundamentos del tratamiento de la señal de voz y de la fonética del idioma escogido. También resulta necesario poseer nociones adecuadas de todas las áreas relacionadas con el tratamiento de Ja voz, con el fin de enfocar los estudios partiendo de una visión global del campo seleccionado. Las investigaciones desarrolladas en este trabajo se han dividido en dos bloques fundamentales: tratamiento de señal y fonética acústica. En el apartado de. tratamiento de señal, se ha validado la hipótesis inicial. La obtención de los formantes del habla se ha basado en el método de predicción lineal, haciéndose una búsqueda de polos fuera de la zona habitual (el círculo unidad). La decisión de trabajar con funciones espectrales suavizadas ha resultado muy adecuada para la estimación de los formantes de voz. Partiendo de estas funciones espectrales se han ideado diferentes etapas que van detectando y resaltando los formantes del habla haciendo uso de transformaciones no lineales basadas en métodos algorítmicos. En el bloque reservado para las investigaciones en fonética acústica española, se aportan mapas tridimensionales de sonidos vocálicos que sirven como modelo para la extensión de las frecuentes clasificaciones bidimensionales que se utilizan en las publicaciones especializadas de fonética acústica. El empleo de una tercera dimensión permite complementar la información tradicional usada en las representaciones vocálicas. Así mismo se aportan trabajos que estudian Ja evolución de Jos formantes en situaciones de coarticulación. Estos trabajos se pueden considerar como una referencia innovadora para el desarrollo de investigaciones más elaboradas que se basen en Jos métodos y herramientas originales empleados en la tesis. En esta tesis se ofrece abundante y variado material en forma de espectros típicos, generalización de la evolución de los formantes, planos de situación de vocales, etc. Estos datos y resultados, junto a la metodología y herramientas informáticas empleados, pueden servir de base para la creación de aplicaciones que actúen sobre distintas áreas del tratamiento de la voz, tales como la enseñanza asistida de idiomas, logopedia, reconocimiento y síntesis del habla, detección de discapacidades, modelizaciones acústicas basadas en la fonética, etc.---ABSTRACT---This thesis is based on the following hypothesis: using the linear prediction method, it is possible to devise signal processing algorithms which obtain a good estimation of significant spectral characteristics of the voice, specially the formants of the speech. These algorithms would help to obtain an analytical catalogue of the main sounds of the Spanish Language, and therefore complement the current studies in the acoustic/phonetics area. Most of the complexity of this doctoral thesis comes from the different subjects covered by the speech processing area. The correct determination of diverse spectral characteristics in the speech, requires a deep knowledge in speech signal processing and the phonetics of the chosen language. In addition, it is necessary to incorporate a suitable background of all the subjects closely connected with speech processing. The research carried out in this work has been classified in two main areas: signal processing and acoustic phonetics. In the signal processing field, the initial hypothesis has been validated. The linear prediction method has been used to get the speech formants, searching the poles outside the usual zone (the unit circle). Working with smoothed spectral functions has been very suitable to fix the speech formants. Starting from these spectral functions, different stages have been developed in order to detect and emphasize the speech formants using nonlinear transformations based on algorithmic methods. With respect to the acoustic phonetics of Spanish, three-dimensional maps of vocalic sounds have been obtained. These maps can serve as a model to extend the two-dimensional classifications used in specialized publications of acoustic phonetics. The third dimension allows to complement the traditional information used in the vocalic representations. The formant evolution in "vowel-consonant-vowel" situations has been studied too. This work may be considered as a reference for future research based on the original methods and tools developed. Finally, abundant and varied material is offered in form of typical time-frequency representations, formant evolutions, two-dimensional and three-dimensional maps of vowels, etc. These data and results, the methodology, and the computing tools developed, can serve as a base to create applications related with different speech processing areas, such as computer assisted language learning, recognition and speech synthesis, acoustic modeling based on the phonetics, etc.

Más información

ID de Registro: 42677
Identificador DC: http://oa.upm.es/42677/
Identificador OAI: oai:oa.upm.es:42677
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 09 Sep 2016 08:22
Ultima Modificación: 09 Sep 2016 08:22
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM