Subject-independent acoustic-to-articulatory mapping of fricative sounds by using vocal tract length normalization

Sepúlveda-Sepúlveda, Alexander; Castellanos-Domínguez, Germán y Gómez Vilda, Pedro (2015). Subject-independent acoustic-to-articulatory mapping of fricative sounds by using vocal tract length normalization. "Revista Facultad de Ingeniería" (n. 77); pp. 162-169. ISSN 2357-5328. https://doi.org/10.17533/udea.redin.n77a19.

Descripción

Título: Subject-independent acoustic-to-articulatory mapping of fricative sounds by using vocal tract length normalization
Autor/es:
  • Sepúlveda-Sepúlveda, Alexander
  • Castellanos-Domínguez, Germán
  • Gómez Vilda, Pedro
Tipo de Documento: Artículo
Título de Revista/Publicación: Revista Facultad de Ingeniería
Fecha: 2015
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Arquitectura y Tecnología de Sistemas Informáticos
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (784kB) | Vista Previa

Resumen

This paper presents an acoustic-to-articulatory (AtoA) mapping method for tracking the movement of the critical articulators on fricative utterances. The proposed approach applies a vocal tract length normalization process. Subsequently, those acoustic time-frequency features better related to movement of articulators from the statistical perspective are used for AtoA mapping. We test this method on the MOCHA-TIMIT database, which contains signals from an electromagnetic articulograph system. The proposed features were tested on an AtoA mapping system based on Gaussian mixture models, where Pearson correlation coeffi cient is used to measure the goodness of estimates. Correlation value between the estimates and reference signals shows that subject-independent AtoA mapping with proposed approach yields comparable results to subject-dependent AtoA mapping.

Proyectos asociados

TipoCódigoAcrónimoResponsableTítulo
Gobierno de EspañaTEC2012-38630-C04-01Sin especificarUniversidad Politécnica de MadridEVALUACION MULTIMODAL DE TRASTORNOS NEUROLOGICOS MEDIANTE LA CARACTERIZACION DE LA VOZ, DINAMICA DE LOS PLIEGUES VOCALES Y SECUENCIAS SACADICAS
Gobierno de EspañaTEC2012-38630-C04-04Sin especificarUniversidad Politécnica de MadridDETECCION DEL TRASTORNO NEUROLOGICO POR MEDIO DE CORRELATOS DE LA FONACION OBTENIDOS POR MODELADO INVERSO A PARTIR DE LA FUENTE GLOTICA

Más información

ID de Registro: 40916
Identificador DC: http://oa.upm.es/40916/
Identificador OAI: oai:oa.upm.es:40916
Identificador DOI: 10.17533/udea.redin.n77a19
Depositado por: Memoria Investigacion
Depositado el: 26 Oct 2016 09:24
Ultima Modificación: 26 Oct 2016 09:24
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM