Inteligencia artificial para la clasificación de imágenes

Gómez Bueno, Jorge (2020). Inteligencia artificial para la clasificación de imágenes. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Inteligencia artificial para la clasificación de imágenes
Author/s:
  • Gómez Bueno, Jorge
Contributor/s:
  • Talavera Muñoz, Edgar
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: July 2020
Subjects:
Freetext Keywords: API Rest; Datasets; Data Augmentation; Aprendizaje Profundo; Redes Neuronales
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)
[img] Archive (ZIP) - Users in campus UPM only
Download (10kB)

Abstract

Este proyecto tiene como objetivo la generación de modelos de Aprendizaje Profundo capaces de diferenciar entre cierto número de clases proporcionadas por el usuario. A lo largo del objetivo abordaremos los distintos problemas ante los que nos hemos encontrado y las soluciones a las que hemos recurrido. La primera gran barrera que nos encontraremos se encuentra en la obtención de los datos, se hará uso de tecnologías API Rest para la obtención de los mismos, pero debido a las distintas restricciones y a las dificultades que aparecen al intentar generar datos de manera automática necesitaremos recurrir a distintas API Rest y a técnicas de Data Augmentation para la generación de nuevas imágenes de tal manera que nuestros Datasets adquieran mejores propiedades. Una vez afrontemos los problemas que acarrean las API Rest nos encontramos otra piedra en el camino que nos impide generar los Datasets para entrenar a nuestro modelo, este es el procesamiento de las imágenes. Antes de generar nuestros Datasets necesitamos que la entrada a nuestro modelo mantenga un formato común, para conseguirlo necesitamos comprender el formato que adquieren las imágenes a nivel programático y una vez sabido esto trataremos de obtener el formato más liviano y óptimo para proceder a su procesamiento. Una vez hemos creado un formato común para todas las imágenes generaremos nuestros Datasets, estos también nos presentarán problemas puesto que para obtener el mejor modelo de Aprendizaje Profundo necesitamos un buen modelo capaz de llevar a cabo la tarea a realizar pero también unos buenos datos capaces de entrenar nuestro modelo hasta el nivel de rendimiento deseado. ¿Qué hacer si carecemos de la cantidad de datos deseada?¿Qué podemos hacer si nuestros datos no son los adecuados? Por último nos enfrentaremos a las distintas técnicas existentes para la clasificación de imágenes, este es un campo en expansión que se ha encontrado ante una gran evolución en los últimos años. Usaremos la gran mayoría de técnicas que se han descubierto en las últimas décadas, explicaremos de dónde provienen, su fundamento y las pondremos en uso. Todas estas recaen dentro del ámbito de las Redes Neuronales. Abstract: This project aims at generating Deep Learning models capable of distinguishing a certain number of classes provided by the user. Throughout the objective we will address the different problems we have encountered and the solutions we have resorted to. The first big barrier that we will find is obtaining the data, we will use API Rest technologies to obtain it, but due to the different restrictions and difficulties that appear when trying to generate data automatically we will need to resort to different API Rest and Data Augmentation techniques to generate new images in such a way that our Datasets acquire better properties. Once we face the problems caused by the Rest APIs, we find another stone in the path that prevents us from generating the datasets to train our model, this is the processing of the images. Before generating our datasets we need the input to our model to maintain a common format, to achieve this we need to understand the format that the images acquire at a programmatic level and once we know this we will try to obtain the lightest and optimal format to proceed with its processing. Once we have created a common format for all the images we will generate our Datasets, these will also come along with problems since to obtain the best Deep Learning model we need a good model capable of carrying out the task to be done but also good data capable of training our model to the desired performance level. What to do if we lack the desired amount of data? What can we do if our data is not adequate? Finally we will face the different existing techniques for the classification of images, this is an expanding field that has faced a great evolution in recent years. We will use most of the techniques that have been discovered in the last decades, explain where they come from, their basis and put them into use. All of these fall within the scope of Neural Networks.

More information

Item ID: 63454
DC Identifier: http://oa.upm.es/63454/
OAI Identifier: oai:oa.upm.es:63454
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 11 Aug 2020 08:07
Last Modified: 11 Aug 2020 08:07
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM