Full text
![]() |
PDF
- Users in campus UPM only
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) |
![]() |
Archive (ZIP)
- Users in campus UPM only
Download (10kB) |
Gómez Bueno, Jorge (2020). Inteligencia artificial para la clasificación de imágenes. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.
Title: | Inteligencia artificial para la clasificación de imágenes |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Final Project |
Degree: | Grado en Ingeniería del Software |
Date: | July 2020 |
Subjects: | |
Freetext Keywords: | API Rest; Datasets; Data Augmentation; Aprendizaje Profundo; Redes Neuronales |
Faculty: | E.T.S.I. de Sistemas Informáticos (UPM) |
Department: | Sistemas Informáticos |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
![]() |
PDF
- Users in campus UPM only
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) |
![]() |
Archive (ZIP)
- Users in campus UPM only
Download (10kB) |
Este proyecto tiene como objetivo la generación de modelos de Aprendizaje Profundo capaces de diferenciar entre cierto número de clases proporcionadas por el usuario. A lo largo del objetivo abordaremos los distintos problemas ante los que nos hemos encontrado y las soluciones a las que hemos recurrido. La primera gran barrera que nos encontraremos se encuentra en la obtención de los datos, se hará uso de tecnologías API Rest para la obtención de los mismos, pero debido a las distintas restricciones y a las dificultades que aparecen al intentar generar datos de manera automática necesitaremos recurrir a distintas API Rest y a técnicas de Data Augmentation para la generación de nuevas imágenes de tal manera que nuestros Datasets adquieran mejores propiedades. Una vez afrontemos los problemas que acarrean las API Rest nos encontramos otra piedra en el camino que nos impide generar los Datasets para entrenar a nuestro modelo, este es el procesamiento de las imágenes. Antes de generar nuestros Datasets necesitamos que la entrada a nuestro modelo mantenga un formato común, para conseguirlo necesitamos comprender el formato que adquieren las imágenes a nivel programático y una vez sabido esto trataremos de obtener el formato más liviano y óptimo para proceder a su procesamiento. Una vez hemos creado un formato común para todas las imágenes generaremos nuestros Datasets, estos también nos presentarán problemas puesto que para obtener el mejor modelo de Aprendizaje Profundo necesitamos un buen modelo capaz de llevar a cabo la tarea a realizar pero también unos buenos datos capaces de entrenar nuestro modelo hasta el nivel de rendimiento deseado. ¿Qué hacer si carecemos de la cantidad de datos deseada?¿Qué podemos hacer si nuestros datos no son los adecuados? Por último nos enfrentaremos a las distintas técnicas existentes para la clasificación de imágenes, este es un campo en expansión que se ha encontrado ante una gran evolución en los últimos años. Usaremos la gran mayoría de técnicas que se han descubierto en las últimas décadas, explicaremos de dónde provienen, su fundamento y las pondremos en uso. Todas estas recaen dentro del ámbito de las Redes Neuronales. Abstract: This project aims at generating Deep Learning models capable of distinguishing a certain number of classes provided by the user. Throughout the objective we will address the different problems we have encountered and the solutions we have resorted to. The first big barrier that we will find is obtaining the data, we will use API Rest technologies to obtain it, but due to the different restrictions and difficulties that appear when trying to generate data automatically we will need to resort to different API Rest and Data Augmentation techniques to generate new images in such a way that our Datasets acquire better properties. Once we face the problems caused by the Rest APIs, we find another stone in the path that prevents us from generating the datasets to train our model, this is the processing of the images. Before generating our datasets we need the input to our model to maintain a common format, to achieve this we need to understand the format that the images acquire at a programmatic level and once we know this we will try to obtain the lightest and optimal format to proceed with its processing. Once we have created a common format for all the images we will generate our Datasets, these will also come along with problems since to obtain the best Deep Learning model we need a good model capable of carrying out the task to be done but also good data capable of training our model to the desired performance level. What to do if we lack the desired amount of data? What can we do if our data is not adequate? Finally we will face the different existing techniques for the classification of images, this is an expanding field that has faced a great evolution in recent years. We will use most of the techniques that have been discovered in the last decades, explain where they come from, their basis and put them into use. All of these fall within the scope of Neural Networks.
Item ID: | 63454 |
---|---|
DC Identifier: | http://oa.upm.es/63454/ |
OAI Identifier: | oai:oa.upm.es:63454 |
Deposited by: | Biblioteca Universitaria Campus Sur |
Deposited on: | 11 Aug 2020 08:07 |
Last Modified: | 11 Aug 2020 08:07 |