Generación de modelos para la anotación automática de imágenes médicas de cáncer de pulmón

Jiménez Andrés, Miriam (2019). Generación de modelos para la anotación automática de imágenes médicas de cáncer de pulmón. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Generación de modelos para la anotación automática de imágenes médicas de cáncer de pulmón
Author/s:
  • Jiménez Andrés, Miriam
Contributor/s:
  • Gonzalo Martín, Consuelo
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: June 2019
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Arquitectura y Tecnología de Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

En este Trabajo de Fin de Grado se aplican técnicas de aprendizaje automático a un conjunto de imágenes médicas para encontrar un modelo de clasificación que permita la anotación de nódulos de cáncer de célula no pequeña en escáneres TAC de un caso real con imágenes médicas procedentes de un hospital público de la Comunidad de Madrid. Para la aplicación de las técnicas deseadas se realiza un preprocesado de las imágenes que permite agilizar y garantizar mejores resultados al omitir información superflua o redundante, además de permitir la estandarización de los datos recibidos. Las pruebas se realizan a dos niveles: nivel de lóbulo pulmonar -segmentando automáticamente los pulmones en lóbulos- y a nivel de supervoxel –aplicando cuatro tamaños de voxel- separando los pulmones en zonas de tamaño uniforme. Los modelos de clasificación analizados son Random Forest, Logistic Regression y Support Vector Machine utilizando como conjunto de entrenamiento características radiómicas procedentes de nódulos de una colección libre de imágenes médicas y aplicadas de tres maneras: utilización de todas las características calculadas, utilización de las características agrupadas por clase y aplicación de Análisis de Componentes Principales con distintos niveles de variabilidad de los datos. Los modelos son evaluados en dos fases: individualmente, analizando el comportamiento del clasificador mediante distintas métricas de evaluación que permita seleccionar el conjunto de entrenamiento y los parámetros del algoritmo de clasificación que mejor se adapta a los datos de las imágenes analizadas; y comparando los resultados de todos los modelos generados para seleccionar el conjunto de modelos de clasificación que mejor resuelve el problema. Los resultados analizados permiten observar que el clasificador se comporta de manera determinista en la mayoría de los experimentos asignando la misma clase a todas las muestras etiquetadas obtenidas con la extracción de características de las imágenes del caso de uso real. Estos resultados reflejan la ineficacia de un clasificador entrenado con características a nivel de nódulo para clasificar características con segmentación a nivel de lóbulo pulmonar, independientemente del algoritmo de clasificación y el conjunto de entrenamiento empleado. Se determina la necesidad de equilibrar las clases añadiendo más muestras de características extraídas de una zona pulmonar que contenga un nódulo y cambiar la metodología para poder utilizar generación de supervóxeles para la extracción de características.---ABSTRACT---In this End-of-Degree Project, automatic learning techniques and a set of medical images are used to find a classification model that allows the annotation of non-small cell cancer nodules in the CT scanners of a real case with medical images sampled from a public Hospital of the Community of Madrid. For the application of the techniques, it is possible to perform a preprocessing of the images that allows to speed up and guarantee better results by omitting superfluous or redundant information, as well as allowing the standardization of the received data. The tests are performed at two levels: lung level -automatically segregating the lungs into lobes- and a supervoxel level -applying four voxel sizes-separating the lungs into areas of uniform size. The classification models analyzed are Random Forest, Logistic Regression and Support Vector Machine using radiomic features from a collection of medical images as a training set. This set is applied in two ways: use of all the calculated characteristics and application of Principal Components Analysis with different levels of data variability. The models are evaluated in two phases: individually and comparison. The former consisting on analyzing the behavior of the classifier by means of different evaluation techniques that allow selecting the training set and the parameters of the classification algorithm that best adapts to the data of the analyzed images. The later, comparing the results of all the models generated to select the set of classification models that best solve the problem. The analyzed results show that the classifier behaves in a deterministic way in the majority of the times, assigning the same class to all the samples labeled with the extraction of characteristics of the images of the real use case. These results include the ineffectiveness of a trained classifier with nodule level features to classify the features with segmentation at the pulmonary lobe level, independently of the classification algorithm and the training set used. It is needed to balance the classes by adding more samples of features extracted from a lung zone containing a nodule and changing the methodology to be able to use supervoxel generation for the extraction of features.

More information

Item ID: 55781
DC Identifier: http://oa.upm.es/55781/
OAI Identifier: oai:oa.upm.es:55781
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 10 Jul 2019 12:35
Last Modified: 10 Jul 2019 12:35
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM