Breast cancer segmentation with weakly-supervised connected U-Nets

Nájera Lavid, Guillermo (2024). Breast cancer segmentation with weakly-supervised connected U-Nets. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título: Breast cancer segmentation with weakly-supervised connected U-Nets
Autor/es:
  • Nájera Lavid, Guillermo
Director/es:
Tipo de Documento: Tesis (Master)
Título del máster: Digital Innovation: Data Science
Fecha: Septiembre 2024
Materias:
ODS:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFM_GUILLERMO_NAJERA_LAVID.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (3MB)

Resumen

El cáncer de mama es una de las principales causas de muertes relacionadas con el cáncer en mujeres a nivel mundial, lo que denota la imperiosa necesidad de una detección temprana y un diagnóstico preciso. La resonancia magnética dinámica con contraste (DCE-MRI) se ha convertido en una herramienta fundamental en la detección del cáncer de mama, ya que ofrece información detallada sobre la morfología, la textura y la cinética del tumor. Sin embargo, segmentar con precisión las regiones cancerosas en estas resonancias es una tarea compleja que tradicionalmente se ha realizado de manera manual. Un proceso laborioso, que consume mucho tiempo y está sujeto a variabilidad. Este proyecto se centra en abordar estos desafíos mediante la implementación de una estrategia de aprendizaje débilmente supervisado llamada Similarity-Aware Propagation Learning (SimPLe), diseñada para mejorar el proceso de segmentación en DCE-MRI utilizando anotaciones mínimas.

La estrategia SimPLe introduce un proceso de aprendizaje en tres fases que optimiza la red de segmentación utilizando solo anotaciones mediante puntos extremos que representan los límites más distantes de la región cancerosa en las resonancias 3D. El método comienza con la generación de pseudo-máscaras iniciales utilizando un algoritmo específico, guiado por los puntos extremos para aproximar los bordes del tumor. Estas pseudo-máscaras se utilizan en la primera fase de entrenamiento, permitiendo que la arquitectura de U-Net conectada aprenda tareas básicas de segmentación. En la segunda fase, la red se somete a un ajuste fino mediante una estrategia de propagación consciente de la similitud, que refina la segmentación propagando etiquetas basadas en similitudes de características entre los vóxeles etiquetados y no etiquetados. La fase final implica reentrenar la red con las pseudo-máscaras actualizadas, mejorando aún más la precisión de la segmentación.

Este estudio implementó inicialmente la estrategia SimPLe en el conjunto de datos original de DCE-MRI proporcionado por los investigadores, que contenía 206 exploraciones de cáncer de mama confirmadas por biopsia y anotadas por radiólogos. Para ampliar la aplicabilidad de este enfoque, se ha buscado aplicarlo al conjunto de datos Duke-Breast-Cancer-MRI, que consta de 922 exploraciones DCE-MRI con resoluciones de imagen variadas y anotaciones exhaustivas de radiólogos. Sin embargo, adaptar la estrategia SimPLe a este nuevo conjunto de datos plantea desafíos significativos debido a diferencias en los estilos de anotación y las estructuras de datos.

Para abordar esto, se desarrollará un enfoque modificado de generación de pseudo-máscaras, ajustando estos puntos extremos de una manera distinta, que permita adaptar el algoritmo a un uso de datos más general, para después entrenar nuestro propia implementación del modelo mencionado ajustándolo no solo a nuestro conjunto de datos, sino también a cualquier posible representación más generalizada de este tipo de datos.

ABSTRACT

Breast cancer is one of the leading causes of cancer-related deaths in women worldwide, highlighting the urgent need for early detection and accurate diagnosis. Dynamic contrast-enhanced magnetic resonance imaging (DCEMRI) has become a fundamental tool in breast cancer detection, providing detailed information about tumor morphology, texture, and kinetics. However, accurately segmenting cancerous regions in these MRIs is a complex task that has traditionally been done manually, a laborious, time-consuming process subject to variability. This project focuses on addressing these challenges through the implementation of a weakly supervised learning strategy called Similarity-Aware Propagation Learning (SimPLe), designed to enhance the segmentation process in DCE-MRI using minimal annotations.

The SimPLe strategy introduces a three-phase learning process that optimizes the segmentation network using only annotations through extreme points that represent the most distant boundaries of the cancerous region in 3D MRIs. The method begins with the generation of initial pseudo-masks using a specific algorithm guided by the extreme points to approximate the tumor edges. These pseudo-masks are used in the first training phase, allowing the connected U-Net architecture to learn basic segmentation tasks. In the second phase, the network undergoes fine-tuning through a similarity-aware propagation strategy, which refines the segmentation by propagating labels based on feature similarities between labeled and unlabeled voxels. The final phase involves retraining the network with updated pseudo-masks, further improving the segmentation accuracy.

This study initially implemented the SimPLe strategy on the original DCE-MRI dataset provided by the researchers, containing 206 scans of biopsy-confirmed breast cancer, annotated by radiologists. To expand the applicability of this approach, an attempt will be made to apply it to the Duke-Breast-Cancer-MRI dataset, which consists of 922 DCE-MRI scans with varied image resolutions and exhaustive radiologist annotations. However, adapting the SimPLe strategy to this new dataset presents significant challenges due to differences in annotation styles and data structures.

To address this, a modified approach for pseudo-mask generation will be developed, adjusting these extreme points differently to make the algorithm adaptable to more general data usage. This will enable us to train our own implementation of the mentioned model, adjusting it not only to our dataset but also to any possible generalized representation of this type of data.

Más información

ID de Registro: 84320
Identificador DC: https://oa.upm.es/84320/
Identificador OAI: oai:oa.upm.es:84320
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 19 Oct 2024 08:29
Ultima Modificación: 19 Oct 2024 08:29