Reconocimiento de emociones por medio de voz

Vargas Sandoval, Vanessa (2019). Reconocimiento de emociones por medio de voz. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Reconocimiento de emociones por medio de voz
Author/s:
  • Vargas Sandoval, Vanessa
Contributor/s:
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2019
Subjects:
Freetext Keywords: Clasificación de emociones por medio de voz; Mfcc; SVM; KNN; RF; MPL; Speech emotion classification
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFM_VANESSA_VARGAS_SANDOVAL.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

En el presente trabajo se realiza un análisis de la precisión en la clasificación de las emociones utilizando archivos de audio. Para ello se utiliza el extractor de características Mfcc (Mel-frequency cepstral coefficients), analizando los resultados con 13, 20, 27 Mfccs también conocidos como vectores acústicos. Los audios de entrada de los modelos propuestos son archivos de la base de datos RAVDESS, la cual tiene lecturas de audio de 8 diferentes tipos de emociones: neutral, calma, felicidad, tristeza, enojo, miedo, disgusto, sorpresa. Se testean modelos utilizando 8, 6 y 4 emociones, seleccionadas bajo diferentes criterios. Los clasificadores utilizados son SVM, KNN, RF y MPL. Obteniendo resultados de hasta 82% de precisión.---ABSTRACT---In this work an analysis of the accuracy in the classification of emotions is carried out using audio files. For this, the Mfcc (Mel-frequency cepstral coefficients) feature extractor is used, analyzing the results with 13, 20, 27 Mfccs, also known as acoustic vectors. The input audios of the proposed models are files of the RAVDESS database, which has audios of 8 different types of emotions: neutral, calm, happiness, sadness, anger, fear, disgust, surprise. Models are tested using 8, 6 and 4 emotions, selected under different criteria. The classifiers used are SVM, KNN, RF and MPL. Obtaining results of up to 82% accuracy.

More information

Item ID: 56027
DC Identifier: https://oa.upm.es/56027/
OAI Identifier: oai:oa.upm.es:56027
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 30 Jul 2019 06:45
Last Modified: 30 Jul 2019 06:45
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM