Análisis y desarrollo de modelos de predicción de links en redes mediante técnicas de Deep Learning

Ayuso Muñoz, Adrián (2022). Análisis y desarrollo de modelos de predicción de links en redes mediante técnicas de Deep Learning. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Análisis y desarrollo de modelos de predicción de links en redes mediante técnicas de Deep Learning
Author/s:
  • Ayuso Muñoz, Adrián
Contributor/s:
  • Rodríguez González, Alejandro
  • Prieto Santamaría, Lucía
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: May 2022
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB)

Abstract

Los modelos de predicción de enlaces en grafos tienen como objetivo identificar la existencia de un enlace entre dos nodos en un grafo. Los avances en las técnicas de Deep Learning en la última década han abierto un abanico de posibilidades a la hora de resolver este problema. Para poder trabajar con Deep Learning y grafos, un punto clave será la generación de los embeddings de los nodos. Las Graph Neural Networks, antecedidas por las técnicas conocidas como shallow embeddings, son las herramientas más comunes utilizadas para este propósito. Este trabajo se ha enmarcado en el contexto del reposicionamiento de fármacos, proceso que tiene como objetivo encontrar nuevas indicaciones para fármacos ya existentes. Por ello, se enfocó en la predicción de un tipo de enlace en concreto, entre enfermedades y fármacos, aunque con pequeños ajustes se podrían generalizar las predicciones a otros tipos de enlaces. Los grafos de trabajo han sido del ámbito biomédico, obtenidos a partir de las bases de datos del proyecto DISNET. Se exploraron técnicas de predicción de enlaces en grafos utilizando Deep Learning, concretamente las Graph Neural Networks. Además, se exploró superficialmente la clasificación de enlaces, un caso similar a la primera técnica en el que además de predecir la existencia de un enlace se predijo también su tipo. Se entrenaron, probaron y verificaron los modelos producidos, discutiendo sus diferencias y comparándolos, para así poder seleccionar el mejor como modelo final. Finalmente, se presentó el modelo final seleccionado, el que mejor desempeño tuvo entre los modelos probados, con resultados prometedores. Este modelo mostró valores de 0,89 para AUROC y 0,87 para AUPRC cuando se le presentaron casos de reposicionamiento previamente probados experimentalmente, y completamente nuevos para el modelo. Valores excelentes y que validaron este enfoque para la generación de hipótesis de reposicionamiento de fármacos.---ABSTRACT---Graph link prediction models aim to predict the existence of a link between two nodes of a graph. Advances in Deep Learning techniques over the last decade have opened a wide range of opportunities to solve this problem. To work with Deep Learning and graphs, a key point will be the generation of embeddings of the nodes. Graph Neural Networks, preceded by techniques known as shallow embeddings, are the most common tools used for this purpose. This work has been framed in the context of drug repositioning, a process that aims to find new indications for existing drugs. Therefore, it focused on the prediction of a specific type of edge, although with minor adjustments the predictions could be generalised to other edge types. The used graphs were from the biomedical field, obtained from the DISNET project databases. Edge prediction in graphs techniques using Deep Learning were explored, particularly Graph Neural Networks. In addition, edge classification was superficially explored, a similar case to the first technique in which, in addition to predicting the existence of an edge, its type was also predicted. The models were trained, tested, and verified, discussing their differences, and comparing them, in order to select the best one as the final model. Finally, the final selected model was presented, the one that performed the best among the tested models, with promising results. This model showed values of 0.89 for AUROC and 0.87 for AUPRC when it was presented with repositioning cases previously tested experimentally, and completely new to the model. These values were excellent and validated this approach for the generation of drug repositioning hypotheses.

More information

Item ID: 71002
DC Identifier: https://oa.upm.es/71002/
OAI Identifier: oai:oa.upm.es:71002
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 07 Jul 2022 11:01
Last Modified: 07 Jul 2022 11:01
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM