Creación de un grafo de conocimiento usando extracción de relaciones a partir de entidades nombradas extraídos de archivos Readme

Cardozo Blanco, Andrés (2022). Creación de un grafo de conocimiento usando extracción de relaciones a partir de entidades nombradas extraídos de archivos Readme. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Descripción

Título: Creación de un grafo de conocimiento usando extracción de relaciones a partir de entidades nombradas extraídos de archivos Readme
Autor/es:
  • Cardozo Blanco, Andrés
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Ingeniería Informática
Fecha: 2 Junio 2022
Materias:
ODS:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_ANDRES_CARDOZO_BLANCO.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB)

Resumen

Este trabajo presenta una posible solución, que hará que las consultas de información ficheros README de software ciéntifico sea más fácil. Normalmente, cuando el software en ámbito de desarrollado en investigaciones y/o que tienen carácter científico, no es posible acceder de manera programática a la información, porque cada README está escrito en lenguaje natural, lo cual lleva a múltiples estilos de escritura diferentes, hechos por uno o varios desarrolladores del software. Para la extracción, es necesario usar técnicas de procesamiento de lenguaje natural [1]. Aunque ya existan frameworks que obtienen entidades, no es suficiente para generar un grafo de conocimiento completo. Por este motivo, el proyecto se centrará en crear una librería que busca y añade relaciones para completar grafo y proporcionar peticiones de estos software científicos. El alcance de este trabajo incluirá: Las técnicas y herramientas en las cuales se basará el modelo. La representación de los datos finales. Documentación de diseño creada para representar formalmente el modelo. Prototipo inicial, desarrollo y resultados producidos por este. Además, de las tareas anteriores, se analizará el impacto potencial de los resultados obtenidos de este proyecto, sus efectos positivos y negativos, si los hubiera, así como también las conclusiones y futuros desarrollos.---ABSTRACT---This work presents a possible solution, that will grant easier ways to make information consults from a README file of scientific software. Normally, when software from a investigation environment and/or a scientific character, it’s not posible to access that infomation in a manner, because each README is written in natural language, which leads to many differents styles of writting, made by one or more developers of such software. For the extraction, it is neccesary to use Natural Proccessing Language[1] techniques. Although there exists frameworks that obtain entities, it is not enough for generate a complet knowledge graph . Fpr this motive, the porject will focus on creating a library that searches and adds relationships for completing de graph and enable requests for this scientific softwares. The coverage will include: Techniques and tools in which our model will be based. The representation of our final data. Design documentation created to represent the model formally. Initial prototype, development and results produced by it. Also, from previous tasks, we will analyze the potencial impact this project, it’s positive and negative effects, if there are any, as well as it’s conclusions and future developments.

Más información

ID de Registro: 71156
Identificador DC: https://oa.upm.es/71156/
Identificador OAI: oai:oa.upm.es:71156
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 13 Jul 2022 10:59
Ultima Modificación: 03 Abr 2025 06:19