Selection of TDOA Parameters for MDM Speaker Diarization

Martínez González, Beatriz; Pardo Muñoz, José Manuel; Echeverry Correa, Julian David; Vallejo Pinto, José Ángel y Barra Chicote, Roberto (2012). Selection of TDOA Parameters for MDM Speaker Diarization. En: "InterSpeech 2012, 13th Annual Conference of the International Speech Communication Association", 09/09/2012 - 13/09/2012, Portland, Oregon. pp. 1-4.

Descripción

Título: Selection of TDOA Parameters for MDM Speaker Diarization
Autor/es:
  • Martínez González, Beatriz
  • Pardo Muñoz, José Manuel
  • Echeverry Correa, Julian David
  • Vallejo Pinto, José Ángel
  • Barra Chicote, Roberto
Tipo de Documento: Ponencia en Congreso o Jornada (Artículo)
Título del Evento: InterSpeech 2012, 13th Annual Conference of the International Speech Communication Association
Fechas del Evento: 09/09/2012 - 13/09/2012
Lugar del Evento: Portland, Oregon
Título del Libro: InterSpeech 2012, 13th Annual Conference of the International Speech Communication Association
Fecha: Septiembre 2012
Materias:
Palabras Clave Informales: Speaker diarization, speaker localization, speaker identification, speaker segmentation
Escuela: E.T.S.I. Telecomunicación (UPM)
Departamento: Ingeniería Electrónica
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (477kB) | Vista Previa

Resumen

Several methods to improve multiple distant microphone (MDM) speaker diarization based on Time Delay of Arrival (TDOA) features are evaluated in this paper. All of them avoid the use of a single reference channel to calculate the TDOA values and, based on different criteria, select among all possible pairs of microphones a set of pairs that will be used to estimate the TDOA's. The evaluated methods have been named the "Dynamic Margin" (DM), the "Extreme Regions" (ER), the "Most Common" (MC), the "Cross Correlation" (XCorr) and the "Principle Component Analysis" (PCA). It is shown that all methods improve the baseline results for the development set and four of them improve also the results for the evaluation set. Improvements of 3.49% and 10.77% DER relative are obtained for DM and ER respectively for the test set. The XCorr and PCA methods achieve an improvement of 36.72% and 30.82% DER relative for the test set. Moreover, the computational cost for the XCorr method is 20% less than the baseline.

Más información

ID de Registro: 20413
Identificador DC: http://oa.upm.es/20413/
Identificador OAI: oai:oa.upm.es:20413
Depositado por: Memoria Investigacion
Depositado el: 05 Oct 2013 10:18
Ultima Modificación: 21 Abr 2016 23:12
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM