UPM-UC3M system for music and speech segmentation

Gallardo Antolín, Ascensión y San Segundo Hernández, Rubén (2010). UPM-UC3M system for music and speech segmentation. En: "VI Jornadas en Tecnología del Habla and II Iberian SLTech Workshop", 10/11/2010 - 12/11/2010, Vigo, España.

Descripción

Título: UPM-UC3M system for music and speech segmentation
Autor/es:
  • Gallardo Antolín, Ascensión
  • San Segundo Hernández, Rubén
Tipo de Documento: Ponencia en Congreso o Jornada (Artículo)
Título del Evento: VI Jornadas en Tecnología del Habla and II Iberian SLTech Workshop
Fechas del Evento: 10/11/2010 - 12/11/2010
Lugar del Evento: Vigo, España
Título del Libro: Proceedings of the VI Jornadas en Tecnología del Habla and II Iberian SLTech Workshop
Fecha: 2010
Materias:
Escuela: E.T.S.I. Telecomunicación (UPM)
Departamento: Ingeniería Electrónica
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (347kB) | Vista Previa

Resumen

This paper describes the UPM-UC3M system for the Albayzín evaluation 2010 on Audio Segmentation. This evaluation task consists of segmenting a broadcast news audio document into clean speech, music, speech with noise in background and speech with music in background. The UPM-UC3M system is based on Hidden Markov Models (HMMs), including a 3-state HMM for every acoustic class. The number of states and the number of Gaussian per state have been tuned for this evaluation. The main analysis during system development has been focused on feature selection. Also, two different architectures have been tested: the first one corresponds to an one-step system whereas the second one is a hierarchical system in which different features have been used for segmenting the different audio classes. For both systems, we have considered long term statistics of MFCC (Mel Frequency Ceptral Coefficients), spectral entropy and CHROMA coefficients. For the best configuration of the one-step system, we have obtained a 25.3% average error rate and 18.7% diarization error (using the NIST tool) and a 23.9% average error rate and 17.9% diarization error for the hierarchical one.

Más información

ID de Registro: 6947
Identificador DC: http://oa.upm.es/6947/
Identificador OAI: oai:oa.upm.es:6947
URL Oficial: http://fala2010.uvigo.es/
Depositado por: Memoria Investigacion
Depositado el: 10 May 2011 09:11
Ultima Modificación: 20 Abr 2016 16:03
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM