Diseño e implementación de una herramienta software para la recopilación y el procesamiento de datos heterogéneos orientada a la extracción de conocimiento en el ámbito de las enfermedades raras

Bravo Cuadro, Mario and Pintilie, Emil Stelian (2025). Diseño e implementación de una herramienta software para la recopilación y el procesamiento de datos heterogéneos orientada a la extracción de conocimiento en el ámbito de las enfermedades raras. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Descripción

Título: Diseño e implementación de una herramienta software para la recopilación y el procesamiento de datos heterogéneos orientada a la extracción de conocimiento en el ámbito de las enfermedades raras
Autor/es:
  • Bravo Cuadro, Mario
  • Pintilie, Emil Stelian
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Ingeniería del Software
Fecha: 22 Julio 2025
Materias:
ODS:
Palabras Clave Informales: Bioinformática; Enfermedades raras; Extracción de conocimiento; Procesamiento de datos heterogéneos; Bases de datos biomédicas
Escuela: E.T.S.I. de Sistemas Informáticos (UPM)
Departamento: Sistemas Informáticos
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_MARIO_BRAVO_CUADRO.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (8MB)

Resumen

El objetivo de este proyecto es desarrollar un sistema de extracción de conocimiento biomédico que facilite el proceso de obtención de información relevante para la investigación en enfermedades raras. El sistema está diseñado para abordar los desafíos comunes que enfrentan los investigadores biomédicos al acceder y procesar información distribuida en múltiples fuentes de datos heterogéneas.

El proyecto se centra en el desarrollo de una plataforma que proporciona información clave de manera estructurada y eficiente, reduciendo significativamente los tiempos de extracción de información determinante de semanas a minutos. Esto permite a los investigadores invertir plenamente su esfuerzo en el análisis y toma de decisiones basadas en la información obtenida, optimizando así los procesos de investigación biomédica.

Aunque el sistema ha sido desarrollado en colaboración específica con representantes del Instituto de Investigación de Enfermedades Raras (IIER) asociado al Instituto de Salud Carlos III, su arquitectura modular y extensible permite su aplicación en otros contextos de investigación biomédica. El proyecto se ha desarrollado en un entorno de trabajo real, donde los requisitos obtenidos, así como la validación del producto y los distintos prototipos construidos se han elaborado bajo el contexto de una necesidad concreta de un cliente real. Esta característica se traduce en una atención más detallada a las distintas fases de desarrollo y a la obligación de poner en práctica competencias transversales que van más allá de los objetivos habituales de un Trabajo de Fin de Grado, como la comunicación efectiva, la gestión de tiempos y el trabajo en equipos multidisciplinares.

La necesidad específica que aborda el sistema reside en la dificultad generalizada para obtener información útil para la toma de decisiones debido al carácter heterogéneo de los datos biomédicos y su irregular distribución entre distintas fuentes de datos especializadas.

El sistema está desarrollado en Python y dispone de una API que permite generar informes predefinidos y modificables. La plataforma accede internamente y de forma programática a las distintas fuentes de datos biomédicos, transformando los datos recibidos para darles un formato claro y visual: combina la información de distintas fuentes para generar un informe final estructurado que facilite el trabajo de investigación.

Abstract:

The objective of this project is to develop a biomedical knowledge extraction system that facilitates the process of obtaining relevant information for rare disease research. The system is designed to address the common challenges faced by biomedical researchers when accessing and processing information distributed across multiple heterogeneous data sources.

The project focuses on developing a platform that provides key information in a structured and efficient manner, significantly reducing the time for extracting critical information from weeks to minutes. This allows researchers to fully invest their efforts in analysis and decision-making based on the obtained information, thus optimizing biomedical research processes.

Although the system has been developed in specific collaboration with representatives from the Institute for Rare Disease Research (IIER) associated with the Instituto de Salud Carlos III, its modular and extensible architecture allows its application in other biomedical research contexts. The project has been developed in a real working environment, where the obtained requirements, as well as the product validation and the different prototypes built have been elaborated under the context of a concrete need from a real client. This characteristic translates into more detailed attention to the different development phases and the obligation to put into practice transversal competencies that go beyond the usual objectives of a Final Degree Project, such as effective communication, time management, and work in multidisciplinary teams.

The specific need addressed by the system lies in the widespread difficulty of obtaining useful information for decision-making due to the heterogeneous nature of biomedical data and its irregular distribution among different specialized data sources.

The system is developed in Python and has an API that allows generating predefined and modifiable reports. The platform internally and programmatically accesses different biomedical data sources, transforming the received data to give them a clear and visual format: it combines information from different sources to generate a structured final report that facilitates research work.

Más información

ID de Registro: 91881
Identificador DC: https://oa.upm.es/91881/
Identificador OAI: oai:oa.upm.es:91881
Depositado por: Biblioteca Universitaria Campus Sur
Depositado el: 15 Nov 2025 10:22
Ultima Modificación: 14 Ene 2026 01:45