Seguimiento de locutor para autenticación biométrica en dispositivos móviles

Montoro Rodríguez, Daniel (2019). Seguimiento de locutor para autenticación biométrica en dispositivos móviles. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. y Sistemas de Telecomunicación (UPM), Madrid.

Description

Title: Seguimiento de locutor para autenticación biométrica en dispositivos móviles
Author/s:
  • Montoro Rodríguez, Daniel
Contributor/s:
  • Simón Zorita, Danilo
  • Vaquero Avilés-Casco, Carlos
Item Type: Final Project
Degree: Grado en Ingeniería de Sonido e Imagen
Date: January 2019
Subjects:
Freetext Keywords: Biometría
Faculty: E.T.S.I. y Sistemas de Telecomunicación (UPM)
Department: Teoría de la Señal y Comunicaciones
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview
[img] Archive (ZIP) - Users in campus UPM only
Download (117kB)

Abstract

Este proyecto consiste en el diseño de un sistema de seguimiento de locutor. El sistema recibe audio en tiempo real y, en caso de detectar voz, determina si esta es la de un usuario conocido o la de un impostor. Se procura que sus requerimientos de memoria y capacidad de procesado sean mínimos, para su uso en dispositivos móviles. La implementación se realiza en lenguaje Python, como parte de un entorno de trabajo que facilita el desarrollo continuado del mismo así como su evaluación. El sistema se basa en el esquema básico para realizar verificación de locutor, aplicando la tecnología UBM-GMM y utilizando coeficientes cepstrales de mel (MFCC) normalizados en media y varianza y normalización de puntuaciones en base a cohortes. Este esquema es descrito en la primera parte del documento. A continuación se presenta el diseño propuesto, que amplía dicho esquema para trabajar en tiempo real, y se detalla el proceso de desarrollo de cada parte del mismo. De igual manera, se presenta el entorno de trabajo creado. Finalmente, se presentan resultados obtenidos de acuerdo a las directrices de la convocatoria NIST SRE 2008 de evaluación de sistemas de biometría de voz, y se proponen varias lineas de investigación para la posible continuación del desarrollo. Abstract: This project consists on the design of a speaker tracking system. The system captures audio in real time and, if voice is detected, it must determine if the speaker is a known user or an impostor. Its memory and processing power requirements are sought to be minimum, in order to be implemented in mobile devices. The system is implemented in Python, as part of a environment that seeks to facilitate the subsequent development work. The system is based on the basic scheme of a speaker verification system based on UBM-GMM, using MFCCs normalized with the CMVN technique and cohort-based score normalization. This design is described in the first part of the document. Then the proposed design is presented, which extends said scheme to work on real time, and the development process is detailed. The implemented environment is also presented. Finally, results are shown for the NIST SRE 2008 evaluation of speaker recognition systems, and a number of lines of research are proposed.

More information

Item ID: 56576
DC Identifier: http://oa.upm.es/56576/
OAI Identifier: oai:oa.upm.es:56576
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 26 Sep 2019 13:29
Last Modified: 26 Sep 2019 13:29
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM