Digital signal processing techniques for application in the analysis of pathological voice and normophonic singing voice

Murphy, Katharine (2008). Digital signal processing techniques for application in the analysis of pathological voice and normophonic singing voice. Thesis (Doctoral), Facultad de Informática (UPM).

Description

Title: Digital signal processing techniques for application in the analysis of pathological voice and normophonic singing voice
Author/s:
  • Murphy, Katharine
Contributor/s:
  • Gómez Vilda, Pedro
Item Type: Thesis (Doctoral)
Date: 2008
Subjects:
Freetext Keywords: Larynx, Voice, Singing, Vocal Cords, Vocal Folds, Mass-Spring Systems, Inverse Filtering, Glottal Source, Mucosal Wave, Multivariate Statistical Analysis, Digital Signal Processing Laringe, Voz, Canto, Cuerdas Vocales, Sistemas de Masa y Elasticidad, Filtrado Inverso, Fuente Glótica, Onda Mucosa, Análisis Estadístico Multivariable, Procesando de Señales Digitales
Faculty: Facultad de Informática (UPM)
Department: Arquitectura y Tecnología de Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (5MB) | Preview

Abstract

Singing voice is one specific example of vocal sound made by human beings. If we consider the larynx apparatus as a type of singing instrument then we can further say that sung voice is perhaps the best and most stable utilisation of such an instrument. Singing remains at a stable pitch over time, and professional singers may well be the people who utilise the vocal apparatus most appropriately. If we compare a healthy sustained vowel given by a non-singer to that given by a professional singer, the difference in quality of recording can be seen in the stability of energy, pitch, jitter, shimmer and other classical perturbation parameters of Voice Quality assessment. In order to make assumptions about the health of the voice, signals produced at the vocal folds are the most interesting, as it is around this area specifically that most vocal problems are encountered. Using Digital Signal Processing techniques to extract such signals we can ascertain a number of things. Firstly, we can examine what happens to the structure of the vocal folds in intonation, and in particular, which parameters are more pertinent than others in analysis of the system. Secondly, we can attempt to use the results to make statistical studies on groups of subjects, in the hope that the pertinent parameters can pull out any abnormal samples. Results from this process have a potential medical application. The thesis will provide a description of the analysis of singing voice, paying particular attention to the changes happening due to pitch increase, and give a detailed example of statistical experimentation using parameters taken from the signals of interest. La voz cantada nos ofrece un ejemplo específico del sonido de la voz humana. Si consideramos el aparato de la laringe como una especie de instrumento para el canto podremos suponer asimismo que la voz cantada nos muestra quizás la mejor y más estable forma de uso de tal instrumento. El canto permanece en una frecuencia estable durante un periodo de tiempo y puede considerarse que los cantantes profesionales son aquellos sujetos que utilizan las cuerdas vocales de forma más apropiada. Si comparamos una vocal estable y continua producida por un cantante no formado con la misma producida por un cantante profesional, la diferencia en la calidad del registro se aprecia en la estabilidad de la energía, frecuencia, jitter, shimmer y los parámetros clásicos de perturbación de uso en la evaluación de la Calidad de la Voz. Para formular una hipótesis acerca de la salud de la voz, las señales más interesantes son las asociadas a las variables dinámicas en las cuerdas vocales porque la mayoría de los problemas de la voz se ponen allí de manifiesto. Al utilizar las técnicas de DSP para extraer tales señales se consigue extraer asimismo una serie de evidencias de gran interés. En primer lugar se puede examinar la dinámica que tiene lugar en la estructura de las cuerdas vocales respecto a la entonación y, en particular, qué parámetros guardan relaciones más importantes que otros en el análisis de la dinámica de dicho sistema. En segundo lugar, se puede utilizar los resultados para llevar a cabo investigaciones estadísticas con grupos de individuos para averiguar si los parámetros pertinentes muestran desviaciones anómalas. Los resultados de este estudio poseen un indudable interés médico. La presente tesis tiene como objetivo proporcionar una descripción del análisis de la voz cantada. Dirige su atención hacia los cambios en la dinámica de la cuerda vocal producidos por las variaciones de la frecuencia y ofrece un ejemplo pormenorizado de la experimentación a mediante la parametrización avanzada de las variables dinámicas de interés.

More information

Item ID: 1079
DC Identifier: http://oa.upm.es/1079/
OAI Identifier: oai:oa.upm.es:1079
Deposited by: Archivo Digital UPM
Deposited on: 07 Jul 2008
Last Modified: 20 Apr 2016 06:41
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM