Evaluation of a transplantation algorithm for expressive speech synthesis

Lorenzo Trueba, Jaime; Barra Chicote, Roberto; Yamagishi, J.; Watts, Oliver y Montero Martínez, Juan Manuel (2013). Evaluation of a transplantation algorithm for expressive speech synthesis. En: "IV Congreso Español de Informática (CEDI 2013). Workshop en Tecnologías Accesibles", 17/09/2013 - 20/09/2013, Madrid, Spain. pp. 1-10.

Descripción

Título: Evaluation of a transplantation algorithm for expressive speech synthesis
Autor/es:
  • Lorenzo Trueba, Jaime
  • Barra Chicote, Roberto
  • Yamagishi, J.
  • Watts, Oliver
  • Montero Martínez, Juan Manuel
Tipo de Documento: Ponencia en Congreso o Jornada (Artículo)
Título del Evento: IV Congreso Español de Informática (CEDI 2013). Workshop en Tecnologías Accesibles
Fechas del Evento: 17/09/2013 - 20/09/2013
Lugar del Evento: Madrid, Spain
Título del Libro: IV Congreso Español de Informática (CEDI 2013). Workshop en Tecnologías Accesibles
Fecha: 2013
Materias:
Palabras Clave Informales: Expressive speech synthesis, emotions, adaptation, expressiveness transplantation
Escuela: E.T.S.I. Telecomunicación (UPM)
Departamento: Ingeniería Electrónica
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (319kB)

Resumen

When designing human-machine interfaces it is important to consider not only the bare bones functionality but also the ease of use and accessibility it provides. When talking about voice-based inter- faces, it has been proven that imbuing expressiveness into the synthetic voices increases signi?cantly its perceived naturalness, which in the end is very helpful when building user friendly interfaces. This paper proposes an adaptation based expressiveness transplantation system capable of copying the emotions of a source speaker into any desired target speaker with just a few minutes of read speech and without requiring the record- ing of additional expressive data. This system was evaluated through a perceptual test for 3 speakers showing up to an average of 52% emotion recognition rates relative to the natural voice recognition rates, while at the same time keeping good scores in similarity and naturality.

Más información

ID de Registro: 26490
Identificador DC: http://oa.upm.es/26490/
Identificador OAI: oai:oa.upm.es:26490
Depositado por: Memoria Investigacion
Depositado el: 14 Jun 2014 12:30
Ultima Modificación: 22 Sep 2014 11:41
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM