Análisis de datos de historia clínica digital

Hurtado Bravo, Sergio (2019). Análisis de datos de historia clínica digital. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Análisis de datos de historia clínica digital
Author/s:
  • Hurtado Bravo, Sergio
Contributor/s:
  • Menasalvas Ruiz, Ernestina
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: January 2019
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (438kB) | Preview

Abstract

En este proyecto se propone la resolución de una problemática que acaece hoy en día a los proyectos de análisis de datos en el dominio médico: la duplicidad de información. El objetivo es eliminar la redundancia de datos de los textos encontrados en los distintos historiales médicos de pacientes, de forma que se pueda obtener información relevante y de calidad. Esta duplicidad aparece en las inserciones de texto en las notas e informes consecutivos de un mismo paciente, generando pequeños fragmentos que referencian a anteriores diagnósticos o anteriores tratamientos. La duplicidad de datos es un problema a abordar antes de poder extraer patrones. Consiguientemente, en este trabajo se plantea una solución que se encarga de eliminar cada uno de los párrafos duplicados de los textos encontrados en documentos consecutivos para un mismo paciente y generará un nuevo fichero con los datos limpios. Los resultados aportados por este software deberán ser integrados en un sistema de procesamiento de lenguaje natural ya existente con arquitectura de microservicios basado en el uso de APIs para la comunicación entre estos.--ABSTRACT--This project proposes the resolution of a problem that happening today to the projects of analysis of data in the medical domain: the duplication of information. The objective is to eliminate the redundancy of data from the texts found in the different medical histories of patients, so that relevant and quality information can be obtained. This duplicity appears in the text insertions in the notes and consecutive reports of the same patient, generating small fragments that refer to previous diagnoses or previous treatments. The data duplicity is a problem to assume before extract patterns. Therefore, in this project is approached a solution that eliminates each of the duplicate paragraphs of the texts found in consecutive documents for the same patient and generate a new file with the clean data. The results of this software will be integrated in a natural language processing system with microservices architecture using an API for the communication.

More information

Item ID: 54337
DC Identifier: http://oa.upm.es/54337/
OAI Identifier: oai:oa.upm.es:54337
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 18 Mar 2019 09:34
Last Modified: 18 Mar 2019 09:34
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM