Clasificador de lesiones de piel en imágenes dermoscópicas con Deep Learning

Jiménez Muñoz, Carlos (2020). Clasificador de lesiones de piel en imágenes dermoscópicas con Deep Learning. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. y Sistemas de Telecomunicación (UPM), Madrid.

Description

Title: Clasificador de lesiones de piel en imágenes dermoscópicas con Deep Learning
Author/s:
  • Jiménez Muñoz, Carlos
Contributor/s:
  • Gutiérrez Arriola, Juana María
Item Type: Final Project
Degree: Grado en Ingeniería de Sonido e Imagen
Date: January 2020
Subjects:
Freetext Keywords: Proceso de imágenes médicas; Ingeniería biomédica
Faculty: E.T.S.I. y Sistemas de Telecomunicación (UPM)
Department: Ingeniería Telemática y Electrónica
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB) | Preview

Abstract

La inteligencia artificial (IA) es una rama de la ciencia de la computación que tiene como objetivo crear y estudiar modelos que interpreten datos externos, aprendan de ellos y resuelvan problemas en base a ese conocimiento adquirido. El aprendizaje automático (o machine learning) es, a su vez, una parte concreta del campo de la inteligencia artificial que automatiza la construcción de modelos analíticos. En concreto, este proyecto gira alrededor del aprendizaje profundo (Deep Learning), una clase de algoritmos integrados en el aprendizaje automático que se apoyan en redes neuronales para completar tareas en campos como la visión artificial, el reconocimiento automático de palabras o el reconocimiento de imágenes. Partiendo de un conjunto de datos proporcionado por la organización del reto “ISIC 2018”, y con el objetivo de dar respuesta a la tercera fase del proyecto propuesto, se ha desarrollado un algoritmo basado en aprendizaje profundo que utiliza una red neuronal para clasificar imágenes clínicas de lesiones de piel. En la primera fase del proyecto, la dedicación estuvo dirigida exclusivamente a la búsqueda de información y contextualización en esta área tecnológica específica: historia de la inteligencia artificial, teoría sobre el aprendizaje profundo y herramientas de Matlab, entorno de desarrollo utilizado, para un proyecto basado en redes neuronales. Adicionalmente, se ha necesitado comprender el funcionamiento de la computación paralela y su módulo correspondiente en Matlab, ya que disponer de una GPU (Unidad de Procesamiento Gráfico) acelera enormemente la realización de tareas de cómputo. Para este proceso ha sido determinante la documentación accesible en Mathworks, plataforma de la corporación homónima que contiene toda la información acerca de librerías y herramientas que pueden ser utilizadas para desarrollar en Matlab. En segundo lugar, se ha realizado el desarrollo. Como primer paso, se dibujó un diagrama de bloques del procedimiento a seguir, representando cada bloque a un script. En este proceso se ha integrado también la fase de pruebas técnicas, ya que el código ha sido probado a medida que se avanzaba en su escritura. Por tanto, el desarrollo ha consistido en el planteamiento y escritura del código, así como la validación técnica de su funcionamiento, suprimiendo errores y resultados incongruentes. En este proceso se ha empleado la red neuronal pre-entrenada AlexNet, que puede ser descargada desde la propia plataforma Mathworks. A través de las herramientas del módulo de redes neuronales de Matlab, se ha modificado la topología de la red para aplicarla al problema de clasificación que trata de resolverse en este proyecto. A esta técnica de utilizar una red pre-entrenada se le llama Transfer Learning (Transferencia de aprendizaje). Toda vez que finalizó el desarrollo, la última etapa ha consistido en la validación de resultados. Tras el proceso de clasificación, se han exportado los datos de cada prueba a una hoja de Excel en la que se analizaba el Recall, medida utilizada para calificar el comportamiento de un sistema de clasificación que contiene números dispares de muestras para cada clase. A lo largo del proceso de validación de resultados se han efectuado pruebas bajo diferentes casuísticas: bien modificando los parámetros de entrenamiento de la red neuronal o bien alterando las imágenes del conjunto de datos modificando propiedades de estas como el brillo, la relación de aspecto o el contraste. Además, se han aprovechado herramientas de transformación de imágenes para utilizar la técnica data augmentation, que consiste en ampliar el número de imágenes de entrenamiento empleando las propias imágenes transformadas a través de giros y efectos de espejo. Por último, y tras la validación de resultados, se han ordenado y clasificado las pruebas con las mayores puntuaciones con el objetivo de facilitar una vía de mejora para próximos proyectos. En este proyecto el mejor resultado conseguido para el clasificador ha sido un Recall del 73,20%, lo que significa que acierta aproximadamente 3 de cada 4 veces que diagnostica una lesión de piel a través de una imagen dermoscópica. Abstract: Artificial intelligence (AI) is a branch of computer science that aims to create and study models that interpret external data, learn from them and solve problems based on that knowledge acquired. Machine learning is, in turn, a concrete part of the field of artificial intelligence that automates the construction of analytical models. Specifically, this project revolves around deep learning, a class of algorithms integrated in machine learning that rely on neural networks to complete tasks in fields such as artificial vision, automatic word recognition or image recognition. Based on a set of data provided by the organization of the "ISIC 2018" challenge, and with the aim of responding to the third phase of the proposed project, an algorithm based on deep learning has been developed that uses a neural network to classify clinical images of skin lesions. In the first phase of the project, the dedication was directed exclusively to the search for information and contextualization in this specific technological area: history of artificial intelligence, theory on deep learning and Matlab tools, development environment used, for a project based in neural networks. Additionally, it has been necessary to understand the operation of parallel computing and its corresponding module in Matlab, since having a GPU (Graphic Processing Unit) accelerates the performance of computing tasks. For this process, the documentation accessible in Mathworks, a platform of the homonymous corporation that contains all the information about libraries and tools that can be used to develop in Matlab, has been decisive. Second, the development has been carried out. As a first step, a block diagram of the procedure to be followed was drawn, each block representing a script. In this process, the technical testing phase has also been integrated, since the code has been tested as the writing progressed. Therefore, the development has consisted in the design and writing of the code, as well as the technical validation of its operation, suppressing errors and incongruent results. In this process, the AlexNet pre-trained neural network has been used, which can be downloaded from the Mathworks platform itself. Through the tools of the Matlab neural network module, the topology of the network has been modified to apply it to the classification problem that is being solved in this project. This technique of using a pretrained network is called Transfer Learning. Once the development was completed, the last stage consisted in the validation of results. After the classification process, the data of each test was exported to an Excel sheet in which the Recall was analyzed, a measure used to qualify the behavior of a classification system that contains different numbers of samples for each class. Throughout the process of validation of results, tests have been carried out under different circumstances: either by modifying the training parameters of the neural network or by altering the images of the data set, modifying properties of these as the brightness, the aspect ratio or the contrast. In addition, image transformation tools have been used to use the data augmentation technique, which consists in expanding the number of training images using the transformed images themselves through turns and mirror effects. Finally, and after the validation of results, the tests with the highest scores have been ordered and classified in order to facilitate a way of improvement for future projects. In this project, the best result achieved for the classifier was a Recall of 73.20%, which means that it hits approximately 3 out of 4 times that it diagnoses a skin lesion through a dermoscopic image.

More information

Item ID: 66911
DC Identifier: https://oa.upm.es/66911/
OAI Identifier: oai:oa.upm.es:66911
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 30 Apr 2021 04:31
Last Modified: 29 Jun 2021 22:30
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM