Desarrollo de un proceso de migración e interfaz web para la visualización de datos contenidos en una BD relacional usando Neo4J

Arias Pedraza, Sergio (2018). Desarrollo de un proceso de migración e interfaz web para la visualización de datos contenidos en una BD relacional usando Neo4J. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Descripción

Título: Desarrollo de un proceso de migración e interfaz web para la visualización de datos contenidos en una BD relacional usando Neo4J
Autor/es:
  • Arias Pedraza, Sergio
Director/es:
  • Rodríguez González, Alejandro
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Matemáticas e Informática
Fecha: Junio 2018
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB) | Vista Previa

Resumen

Este Trabajo de Fin de Grado tiene su origen en el proyecto denominado DISNET (Drug repositioning and disease understanding through complex net works creation and analysis), llevado a cabo por personal del Centro de Tecnología Biomédica de la Universidad Politécnica de Madrid. Este proyecto se divide en varias capas, siendo la primera de ellas la que afecta directamente a este Trabajo de Fin de Grado. En ella se busca como principal finalidad poder crear una red que relacione enfermedades y sus síntomas, de forma que se pueda estudiar si un fármaco usado para tratar una determinada enfermedad es válido para otra con la que comparte gran cantidad de síntomas. Podría ser interesante analizar también si alguno de los fármacos que se usa en una enfermedad que tiene cura, puede ser usado en otra que sea parecida genéticamente y que actualmente no tiene cura con el fin de paliar alguno de sus síntomas. Actualmente se tiene una base de datos de tipo relacional (MySQL) donde se ha ido guardando información a lo largo de los últimos meses en relación a una gran cantidad de enfermedades. La información contenida en DISNET se obtiene a través de diversas fuentes de información existentes en la web, de las que se extraen palabras claves usando diversos mecanismos o filtros y se almacenan en la base de datos, tanto los conceptos que se obtienen como la fuente de la que provienen o cualquier otro dato que pueda ser de utilidad. Este trabajo tiene como finalidad principal ofrecer una visualización apropiada y sencilla de la relaciones que puede haber entre las diferentes tablas de la base de datos, con el fin de que sea más fácil posteriormente la identificación de aquellas enfermedades que comparten características similares. Pero para ello, primero se debe trasladar esa información existente (en MySQL) a un formato de base de datos de grafos (Neo4J). Una vez realizado esto, se diseñará una sencilla interfaz web que permita conectarse a la nueva base de datos y visualizar estos datos. Es muy importante ofrecer una serie de consultas predefinidas que permitan al usuario final interactuar con la base de datos sin necesidad de que sepa cómo ha sido implementada. Como se mostrará a lo largo de la memoria, el proyecto tiene dos partes muy bien diferenciadas: la parte de migración y la parte correspondiente al diseño de la web. Desarrollar la primera ha ocupado los meses de febrero, marzo y parte del mes de abril. Los meses de mayo y junio se han empleado para la segunda. En este documento se precisará con más detalle las herramientas y la metodología llevadas a cabo para cada una de ellas, así como las facilidades y los inconvenientes que se han encontrado.----------ABSTRACT---------- This Final Degree Project has its origin in another project called DISNET (Repositioning of medicines and understanding of diseases through complex net works of creation and analysis), carried out by personnel of the Biomedical Technology Centre of the Polytechnic University of Madrid. This project is divided into several layers, where the first one directly affects this Final Degree Project. One of the most important purposes of this part is developing a network between diseases and symptoms so that it can be studied in an easier way if a drug used for a certain disease can be useful for a similar one. Also, it could be interesting to analyse if any of the drugs used in a disease that has a cure, can be used in another that is genetically similar and that currently has no cure in order to alleviate any of its symptoms. A relational database (MySQL) is currently available, where information has been stored over the past few months in relation to a large number of diseases. The information contained in DISNET is obtained through many web sources and both the concepts obtained and the source from which they come are stored in the database along an y other information that may be useful. The main purpose of this work is to provide an adequate and simple visualization of the relationships that may exist between the different tables of the database, in order to make the identification of similar characteristics easier. The existing information (in MySQL) must be sent to a graph database format (Neo4J). Once this is done, a simple web interface will be designed to connect to the new database and visualize this data. It is very important to offer several predefined queries that allow the end user to interact with the database without needing to know how it has been implemented. As can be seen throughout the document , the project has two very different parts: the part of migration and the part corresponding to the design of the web. Developing the first one have taken the months of February, March and part of April. The months of May and June have been used for the second. This document specifies in more detail the tools and methodology carried out for each one of them, as well as the facilities and inconveniences that were found.

Más información

ID de Registro: 51550
Identificador DC: http://oa.upm.es/51550/
Identificador OAI: oai:oa.upm.es:51550
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 09 Jul 2018 14:13
Ultima Modificación: 09 Jul 2018 14:17
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM