Modelización de una red neuronal capaz de detectar emoticonos en imágenes

Bilbao Lara, Carlos (2022). Modelización de una red neuronal capaz de detectar emoticonos en imágenes. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Modelización de una red neuronal capaz de detectar emoticonos en imágenes
Author/s:
  • Bilbao Lara, Carlos
Contributor/s:
  • San Feliu Gilabert, Tomás
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: May 2022
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)

Abstract

Los emoticonos surgieron por primera vez en 1999, desde entonces su uso no ha parado de crecer, desde las aplicaciones de mensajería hasta ser incorporadas en las imágenes que se suben a las redes sociales. Actualmente el 92% de los usuarios de internet utilizan emoticonos, debido a que permite representar expresiones faciales, facilitando la comunicación y permite expresar más claramente lo que se quiere transmitir con las imágenes. Este trabajo supone un sistema de detección asistida por ordenador capaz de detectar si hay emoticonos en la imagen que cualquier usuario pueda enviarle. El sistema implementado incorpora una interfaz gráfica de usuario que permite la entrada de una imagen base64 que enviará a través de API-REST a un servidor que contiene la red neuronal entrenada previamente. Respecto a la red, contiene todo el contenido acerca de la creación del Dataset óptimo, entrenamiento, validación y un sistema de checkpoint para guardar el mejor progreso realizado por la red neuronal. Esta desarrollado en Pytorch, y basada en la red neuronal GoogleNet, sobre la que se ha realizado Transfer Learning dado que esta está especializada en clasificación de imágenes y modificado las últimas capas para adaptarlas al proyecto. Esta red ha obtenido un resultado de precisión del 99.7891% en entrenamientos y un 96.1214% de precisión en las pruebas. Además, permite reconocer emoticonos de cualquier marca, sin importar de la empresa que los haya realizado, Apple, Google Facebook…. Dado que el proceso de entrenamiento y testeo es muy lento se ha aprovechado que Pytorch permite realizarlo en la GPU de los ordenadores para acelerar el proceso. Con respecto a la interfaz gráfica, se ha desarrollado con React creando una aplicación web que permite a cualquier usuario usar la red de neuronas. (código disponible en el anexo 8.3).---ABSTRACT---Emoticons first appeared in 1999, since then their use has not stopped growing, from messaging applications to being incorporated into images uploaded to social networks. Currently, 92% of internet users use emoticons, because they allow facial expressions to be represented, facilitating communication, and allowing to express more clearly what the creator want to convey with the images. This work involves a computer-assisted detection system capable of detecting whether there are emoticons in the image that any user can send. The implemented system incorporates a graphical user interface that allows the input of a base64 image that it will send through APIREST to a server that contains the previously trained neural network. Regarding the network, it contains all the content about the creation of the optimal Dataset, training, validation, and a checkpoint system to save the best progress made by the neural network. It is developed in Pytorch, and based on the GoogleNet neural network, on which Transfer Learning has been conducted as it is specialised in image classification and the last layers have been modified to adapt them to the project. This network has obtained an accuracy result of 99.7891% in training and 96.1214% accuracy in tests. Moreover, it can recognise emoticons of any brand, regardless of the company that made them, Apple, Google Facebook.... Given that the training and testing process is terribly slow, Pytorch has taken advantage of the fact that it can be conducted on the GPU of computers to speed up the process. About the graphical interface, it has been developed with React, creating a web application that allows any user to use the neuronal network. (Code available on Anexo 8.3)

More information

Item ID: 71006
DC Identifier: https://oa.upm.es/71006/
OAI Identifier: oai:oa.upm.es:71006
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 08 Jul 2022 04:52
Last Modified: 08 Jul 2022 04:52
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM