Multilingual number transcription for text-to-speech conversion

San Segundo Hernández, Rubén; Montero Martínez, Juan Manuel; Giurgiu, M.; Muresan, I. y King, Simon (2013). Multilingual number transcription for text-to-speech conversion. En: "8th ISCA Speech Synthesis Workshop", 31/08/2013 - 02/09/2013, Barcelona, Spain. pp. 65-69.

Descripción

Título: Multilingual number transcription for text-to-speech conversion
Autor/es:
  • San Segundo Hernández, Rubén
  • Montero Martínez, Juan Manuel
  • Giurgiu, M.
  • Muresan, I.
  • King, Simon
Tipo de Documento: Ponencia en Congreso o Jornada (Artículo)
Título del Evento: 8th ISCA Speech Synthesis Workshop
Fechas del Evento: 31/08/2013 - 02/09/2013
Lugar del Evento: Barcelona, Spain
Título del Libro: 8th ISCA Speech Synthesis Workshop
Fecha: 2013
Materias:
Palabras Clave Informales: Multilingual Number Transcription, text normalization, fully-trainable text conversion.
Escuela: E.T.S.I. Telecomunicación (UPM)
Departamento: Ingeniería Electrónica
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
Pdf - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (493kB) | Vista Previa

Resumen

This paper describes the text normalization module of a text to speech fully-trainable conversion system and its application to number transcription. The main target is to generate a language independent text normalization module, based on data instead of on expert rules. This paper proposes a general architecture based on statistical machine translation techniques. This proposal is composed of three main modules: a tokenizer for splitting the text input into a token graph, a phrase-based translation module for token translation, and a post-processing module for removing some tokens. This architecture has been evaluated for number transcription in several languages: English, Spanish and Romanian. Number transcription is an important aspect in the text normalization problem.

Más información

ID de Registro: 30110
Identificador DC: http://oa.upm.es/30110/
Identificador OAI: oai:oa.upm.es:30110
Depositado por: Memoria Investigacion
Depositado el: 02 Ago 2014 11:13
Ultima Modificación: 22 Abr 2016 00:25
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM