Dataflow specification of a K-Means clustering algorithm

Rodríguez Ramos, Marta (2020). Dataflow specification of a K-Means clustering algorithm. Thesis (Master thesis), E.T.S.I. y Sistemas de Telecomunicación (UPM).

Description

Title: Dataflow specification of a K-Means clustering algorithm
Author/s:
  • Rodríguez Ramos, Marta
Contributor/s:
  • Juárez Martínez, Eduardo
Item Type: Thesis (Master thesis)
Masters title: Ingeniería de Sistemas y Servicios para la Sociedad de la Información
Date: March 2020
Subjects:
Freetext Keywords: Imágenes hiperespectrales; Proceso de imágenes médicas; Cáncer; Algoritmos
Faculty: E.T.S.I. y Sistemas de Telecomunicación (UPM)
Department: Ingeniería Telemática y Electrónica
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview

Abstract

En el siglo XXI, la inteligencia artificial muestra una tendencia de crecimiento ascendiente como uno de los campos más importantes en las ciencias computacionales. Además, este campo ha tenido un alto impacto social en la medicina, proporcionando diagnósticos del paciente en tiempo real a través del procesado de imágenes y ensayos clínicos. El presente trabajo de investigación se desarrolla dentro del contexto de HELICoiD. Además, el proyecto de HELICoiD explota las imágenes hiperespectrales ya que éstas se usan en aprendizaje de máquina para detectar y delinear tumores en el cerebro a través de una cadena de procesado. Esta cadena de procesado está compuesta por algoritmos pertenecientes tanto al aprendizaje supervisado como al aprendizaje no supervisado. La precisa delimitación de tumores malignos es una tarea crucial durante una cirugía. Para la extracción del tumor, el neurocirujano es guiado a través de multitud de técnicas. En este enfoque, el algoritmo de agrupamiento llamado K-Means tiene como objetivo la correcta delineación de los bordes del tumor. La implementación de este algoritmo se desarrolla usando una herramienta de especificación de flujo de datos llamada PREESM. Esta herramienta usa el modelo síncrono parametrizado e interconectado de flujo de datos que son extensiones reconfigurables y dinámicas del modelo de flujo de datos síncrono. Este modelo es conocido por su capacidad de análisis, predictividad y expresividad natural de las tareas paralelizadas en algoritmos de procesado de imágenes. El objetivo de paralelizar este algoritmo es acelerar cómputos para la agrupación de los datos y de esta forma acercarse lo más posible al tiempo real. Con el fin de lograr este objetivo, las operaciones atómicas que consumen la mayor parte de tiempo, serán paralelizadas en primer lugar. Los resultados alcanzados, son analizados de forma precisa y validados usando un conjunto de imágenes hiperespectrales in vivo del cerebro humano. Los resultados experimentales muestran que la versión llevada a cabo en PREESM reduce considerablemente el tiempo de ejecución global del algoritmo. Hasta lo que sabemos, el trabajo desarrollado en esta tesis proporciona una implementación en el que es posible acercarse al tiempo real durante las cirugías utilizando arquitecturas más potentes. Abstract: In the 21st century, artificial intelligence has shown an upward trend of growth as one of the most important areas in computer science. Furthermore, this field has had a high social impact on medicine providing real-time medical diagnoses through image processing and clinical trials. The present research work is developed within the context of HELICoiD. Furthermore, HELICoiD project exploits hyperspectral images as they are used along with machine learning for detecting and delineating tumors in brain tissues through a processing toolchain. This toolchain consists of supervised as well as unsupervised methods. The accurate delimitation of brain cancer is an important task having surgery. Several techniques are used to guide neurosurgeons in the removal of the tumor.In this approach, the K-means clustering algorithm aims at the accurate delimitation of the tumor borders. The implementation of this algorithm is performed using a data flow specification tool called PREESM. This tool uses the Parameterized and Interfaced Synchronous DataFlow (SDF) algorithm graph which is a hierarchical and dynamically reconfigurable extension of the Synchronous DataFlow (SDF) model of computation. This model is known for its analyzability, its predictability and its natural expressivity of task parallelism in signal processing algorithms. The objective of parallelizing this algorithm is to speed up computations for data clustering to reach real-time response. In order to achieve this objective, the atomic operations which consume most of the execution time are firstly parallelized. The results achieved are accurately analyzed and validated using an in-vivo hyperspectral human brain image database. Experimental results illustrate that the PREESM version reduces considerably the global execution time of the algorithm. Up to our knowledge, the work done in this thesis provides such a speed-up that the real-time constraint could be achievable during surgery using powerful architectures.

More information

Item ID: 67295
DC Identifier: https://oa.upm.es/67295/
OAI Identifier: oai:oa.upm.es:67295
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 02 Jun 2021 05:14
Last Modified: 31 Aug 2021 09:08
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM