CómicGAN: Generación de ilustraciones con redes GAN de crecimiento progresivo

Iglesias Hernández, Guillermo (2021). CómicGAN: Generación de ilustraciones con redes GAN de crecimiento progresivo. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: CómicGAN: Generación de ilustraciones con redes GAN de crecimiento progresivo
Author/s:
  • Iglesias Hernández, Guillermo
Contributor/s:
  • Talavera Muñoz, Edgar
Item Type: Final Project
Degree: Grado en Tecnologías para la Sociedad de la Información
Date: May 2021
Subjects:
Freetext Keywords: Datasets; Redes neuronales convolucionales; Deep learning; Generative Adversarial Neural Networks (GAN)
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only until 16 July 2021 - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB)
[img] Archive (ZIP) - Users in campus UPM only
Download (14MB)

Abstract

El presente trabajo de fin de grado muestra la implementación de redes generativas adversarias (GANs) para generar ilustraciones completamente nuevas, haciendo uso de imágenes de cómic que previamente han sido estudiadas, normalizadas y filtradas. En la memoria se reflejará la evolución de la investigación, que toma como punto de partida los resultados realizados en un anterior TFG en el cual se plantean los primeros pasos a seguir para obtener un dataset válido. Se presentan el conjunto de pasos para obtener el resultado final: la metodología de trabajo utilizada, la configuración de trabajo en remoto haciendo uso de Google Colab, la búsqueda y estudio de arquitecturas y la evolución y mejora de las distintas redes hasta logar los resultados finales. Para llevar a cabo la generación de ilustraciones de cómic se implementan un conjunto de modelos de forma progresiva, llevando una evolución desde modelos más simples a más complejos y actuales, con el fin de asimilar mejor los conocimientos necesarios. De esta manera finalmente se propone el uso de redes generativas adversarias de crecimiento progresivo o ProGAN. Mediante la utilización de la arquitectura ProGAN se consiguen mejorar los resultados en comparación con el uso de métodos tradicionales llegando a obtener imágenes de gran similitud a las originales, manteniendo la originalidad evitando así la copia directa de imágenes del dataset. A fin de validar y demostrar que los resultados obtenidos son replicables, se ha realizado una comparación entre dos conjuntos de imágenes diferentes. A pesar de que ambos datasets cuentan con el mismo estilo de dibujo, presentan diferencias significativas en su composición. Por una parte se muestran resultados para imágenes de personajes con el cuerpo entero y posteriormente haciendo uso de ilustraciones de caras de personajes en primer plano. Abstract: This final degree work shows the implementation of generative adversarial networks (GANs) to generate completely new illustrations, making use of comic images that have been previously studied, normalized and filtered. The report will reflect the evolution of the research, which takes as a starting point the results of a previous research in which the first steps to follow in order to obtain a valid dataset are proposed. The set of steps to obtain the final result are presented: the work methodology used, the remote work configuration using Google Colab, the search and study of architectures and the evolution and improvement of the different networks to achieve the final results. To carry out the generation of comic illustrations, a set of models are implemented progressively, taking an evolution from simpler to more complex and actual models, in order to better assimilate the necessary knowledge. In this way, the use of progressively growing generative adversarial networks or ProGANs is finally proposed. By using the ProGAN architecture, it is possible to improve the results compared to the use of traditional methods, obtaining images of great similarity to the original ones, maintaining the originality and avoiding the direct copy of images from the dataset. In order to validate and demonstrate that the results obtained are replicable, a comparison between two different sets of images has been performed. Although both datasets have the same drawing style, they present significant differences in their composition. On the one hand, results are shown for images of characters with the whole body and later using illustrations of character faces in the foreground.

More information

Item ID: 67104
DC Identifier: http://oa.upm.es/67104/
OAI Identifier: oai:oa.upm.es:67104
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 17 May 2021 12:06
Last Modified: 17 May 2021 12:06
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM