Construcción de un grafo de conocimiento para la validación de datos

Amezua Lasuen, Gorka (2022). Construcción de un grafo de conocimiento para la validación de datos. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Construcción de un grafo de conocimiento para la validación de datos
Author/s:
  • Amezua Lasuen, Gorka
Contributor/s:
  • García Castro, Raúl
  • Cimmino Arriaga, Andrea Jesús
Item Type: Thesis (Master thesis)
Masters title: Ciencia de Datos
Date: July 2022
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB)

Abstract

A día de hoy, la web está llena de ontologías o grafos de conocimiento creados para dar solución a diferentes problemas y abordar distintas situaciones. A medida que su uso se ha extendido, la tendencia indica a que aún serán más. Sin embargo, esta diversidad, complica la reutilización de terminologías y ontologías ya definidas, y dificulta la interoperabilidad entre sistemas y la implementación de nuevos servicios. Un escenario ideal sería aquel en el que el foco estuviera en la reutilización en vez de en la creación. Para así tratar de conseguir grafos de conocimiento genéricos que se pudieran reutilizar en todo tipo de situaciones. Este proyecto teniendo como meta la reutilización, se centra en dar los primeros pasos en el proceso de consecución de dicho objetivo, mediante la validación de las ontologías existentes. La validación permite obtener información acerca de las restricciones establecidas por los usuarios a diferentes clases y propiedades definidas en sus ontologías, tanto en lo referente a los modelos de datos como a los valores. En este documento se detalla el proceso de automatización de validación de ontologías llevada a cabo. Para la validación de las ontologías se utiliza el lenguaje llamado SHACL, el estándar propuesto por el W3C para la validación de datos RDF. En lo referente a la fuente de datos, de la cual se pretenden obtener las ontologías con las que trabajar, la web de LOV ha sido la elegida. Con más de 10 años de actividad, es una fuente abundante de datos mediante el cual se puede obtener un proceso automatizado adaptable a otros escenarios. Finalmente, para demostrar el uso que pueden llegar a tener este tipo de recursos y mostrar su aplicabilidad, este proyecto también abordará temas como el análisis de formas SHACL, llevando a cabo análisis preliminares sobre los resultados obtenidos.---ABSTRACT---Today, the web is full of ontologies or knowledge graphs created to solve different problems and address different situations. As their use has become more widespread, it can be infered that in future there will be even more. This diversity, however, complicates the reuse of already defined terminologies and ontologies, and hinders interoperability between systems and the implementation of new services. An ideal scenario would be one in which the focus is on reuse rather than creation. In this way, generic knowledge networks that can be reused in all kinds of situations can be achieved. This project, having reuse as its goal, focuses on taking the first steps in the process of achieving this goal by validating existing ontologies. Validation allows obtaining information about the restrictions established by users to different classes and properties defined in their ontologies, both in terms of data models and values. This document details the ontology validation automation process carried out. For the validation of ontologies, the language called SHACL is used, the standard proposed by the W3C for validating RDF data. With regard to the data source, from which it is intended to obtain the ontologies to work with, the LOV website has been chosen. With more than 10 years of activity, it is an abundant source of data through which an automated process adaptable to other scenarios can be obtained. Finally, to demonstrate the use that can be made of this type of resource and to show its applicability, this project will also address issues such as the analysis of SHACL forms, carrying out preliminary analyses on the results obtained.

More information

Item ID: 71447
DC Identifier: https://oa.upm.es/71447/
OAI Identifier: oai:oa.upm.es:71447
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 29 Jul 2022 08:38
Last Modified: 29 Jul 2022 08:38
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM