Desarrollo de una aplicación web para el análisis perceptual de la voz

García barrios, Guillermo (2017). Desarrollo de una aplicación web para el análisis perceptual de la voz. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. y Sistemas de Telecomunicación (UPM), Madrid.

Description

Title: Desarrollo de una aplicación web para el análisis perceptual de la voz
Author/s:
  • García barrios, Guillermo
Contributor/s:
  • Sáenz Lechón, Nicolás
  • Gutiérrez Arriola, Juana María
Item Type: Final Project
Degree: Grado en Ingeniería de Sonido e Imagen
Date: 13 July 2017
Subjects:
Freetext Keywords: Desarrollo web Aparato fonador
Faculty: E.T.S.I. y Sistemas de Telecomunicación (UPM)
Department: Teoría de la Señal y Comunicaciones
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB) | Preview
[img] Archive (ZIP) (Anexos) - Users in campus UPM only
Download (25MB)

Abstract

La voz es una herramienta de comunicación usada constantemente y que puede sufrir alteraciones, sobre todo para las personas que la utilizan como elemento de trabajo. Estas se reflejan como un cambio en la voz por un funcionamiento incorrecto del aparato fonador o del sistema nervioso. La dificultad del problema es encontrar el umbral que determina qué voz es normal y cuál patológica, presentando cierto carácter subjetivo. Este proyecto está basado en la evaluación perceptual de la voz, un método subjetivo que permite determinar si una persona tiene una enfermedad asociada a la voz. La forma de hacerlo es escuchar la voz del paciente y asignar valores a unos parámetros. Estos parámetros son muy diversos y forman parte de una escala, algunas estandarizadas y otras creadas por el propio experto. La idea del proyecto es crear una aplicación web que ayude a realizar la evaluación perceptual de la voz, de tal forma que permita al investigador introducir los protocolos y parámetros asociados, así como ficheros de audio de voces patológicas. Así, el personal médico podrá evaluar las diferentes voces desde su navegador, almacenando los resultados en una base de datos. Con las evaluaciones se pretende hacer un análisis para estudiar la correlación entre los parámetros evaluados y su fiabilidad. En un futuro, esto podría ayudar a mejorar los protocolos de evaluación perceptual de la voz, consiguiendo colecciones de voz mejor etiquetadas para ser utilizadas en el campo de la investigación. Aun así, este proyecto solo se ha encargado del desarrollo de la aplicación web PEPA que permite a los expertos la evaluación de los ficheros de voz y el almacenamiento de sus resultados. Para ello, se ha hecho uso de las tecnologías actuales para el desarrollo de aplicaciones web: el gestor de base de datos MySQL, un servidor Apache, el lenguaje de programación PHP y el framework CakePHP 3. La implementación de la aplicación se ha hecho utilizando un ordenador personal y la documentación pertinente, respetando la privacidad de los datos de los evaluadores y la de las voces los pacientes, y teniendo en cuenta los requisitos de usabilidad y accesibilidad. Finalmente, se ha podido comprobar cómo sin conocimientos previos de programación web y un tiempo de 4 meses, se ha conseguido la primera versión de una aplicación web estable y de fácil uso para la evaluación perceptual de la voz. Abstract: The voice is a frequently used communication tool that can suffer variations, especially in people that use it as a work instrument. These alterations appear like a voice change because of an incorrect functioning of the vocal apparatus or the nervous system. The main problem is to find the threshold that defines which voice is normal and which is pathological. This project is based on the perceptual evaluation of the voice, a subjective method that is used to assess if a person has got a disease associated with the voice. The way to do it is listening to the patient’s voice and assigning values to some parameters. There are a lot of types of parameters, some of them belonging to a standardized scale, while others are created by the expert. The aim of the project is to develop a web application to help making perceptual evaluations of the voice, in such a way that allows the researcher to choose the protocols and associated parameters, and to upload audio files of pathological voices. Then, the clinician will be able to evaluate different voices using his browser and storing all results in a database. These evaluations could later be used to analyse the correlation between the evaluated parameters and their reliability. In the future, this could help to improve the protocols of perceptual evaluation of voice, obtaining better labelled collections of voice to be used in research. In any case, this project is limited to developing a web application called PEPA, which allows experts to evaluate voices files and store their results. For that, we have used the current technologies in web applications development: the MySQL database manager, an Apache web server, the PHP programming language and the CakePHP 3 framework. For developing the software we are going to use a laptop and the required documentation, always respecting the privacy of the data of the evaluators and the patient voices, and keeping in mind the accessibility and usability requirements. Finally, we have verified that without previous knowledge about web programming is possible to develop the first version of a stable and easy to use application for perceptual evaluation of the voice in just 4 months.

More information

Item ID: 52607
DC Identifier: http://oa.upm.es/52607/
OAI Identifier: oai:oa.upm.es:52607
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 15 Oct 2018 05:25
Last Modified: 15 Oct 2018 05:25
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM