Diseño e implementación de un generador de diagramas de ontologías a partir de Wikidata

Íñigo Córdoba, Alejandro (2021). Diseño e implementación de un generador de diagramas de ontologías a partir de Wikidata. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Diseño e implementación de un generador de diagramas de ontologías a partir de Wikidata
Author/s:
  • Íñigo Córdoba, Alejandro
Contributor/s:
  • Corcho García, Óscar
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: February 2021
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB) | Preview

Abstract

Una ontología es una definición formal de tipos, propiedades y relaciones entre entidades que realmente existen para un dominio de discurso en particular. Es una aplicación práctica de la ontología filosófica, con una taxonomía. Cataloga las variables requeridas para algún conjunto de computación y establece las relaciones entre ellos. Se crean ontologías para limitar la complejidad y para organizar la información. Puede esta entonces ser aplicada para resolver problemas. Wikidata es una base de datos libre, colaborativa y multilingüe, que sirve como una base de datos secundaria y que recopila datos estructurados para dar soporte a Wikipedia, Wikimedia Commons, así como a otras wikis del movimiento Wikimedia y a cualquier persona del mundo. Es por ello por lo que, se realizan consultas para obtener información de esta y así poder solucionar problemas. A su vez, se puede utilizar esta información obtenida para analizar datos y llegar a conclusiones. En este proyecto se han utilizado consultas SPARQL realizadas a Wikidata para obtener información de los datos y poder generar lo que se llama un diagrama ontológico. Para ello se han utilizado algoritmos que obtienen instancias, propiedades, etiquetas, etc. de manera que siguiendo un procedimiento rutinario genera un diagrama de ontologías a partir de una clase y un idioma de entrada. La utilidad de este proyecto viene de que el departamento de ontologías de la Universidad Politécnica de Madrid necesita de un generador de diagramas automático para facilitar su trabajo diario. Para realizar este proyecto se ha utilizado el lenguaje de programación Python y se ha estudiado el Orthogonal Layout Algorithm para llegar a este diagrama a partir de una clase y un idioma de entrada. Este algoritmo no fue efectivo al no encontrar suficiente información y el algoritmo terminó siendo diseñado por el autor de este trabajo. Los procedimientos o algoritmo diseñado y seguido para alcanzar el objetivo han sido: en primer lugar, la instalación e importación de librerías, después los inputs de preguntas al usuario para obtener los valores de entrada, luego, la obtención de instancias de la clase de entrada, la obtención de propiedades, la lista que relaciona las propiedades con las clases, la generación de una lista con varias clases y una propiedad y otra con varias propiedades y una clase, luego se etiquetan las propiedades y clases y se procede con la obtención de data properties para introducir en la caja inicial. Dentro de esta última sección, se descartan algunas propiedades que no queremos analizar, se obtienen las data properties a analizar y sin etiquetar, se crea una lista con el número de instancias por propiedad, se ordenan y se etiquetan los seis primeros valores. Por último, se genera el archivo .XML que podrá ser abierto desde draw.io y se podrá ver el diagrama resultante final.---ABSTRACT---An ontology is a types formal definition, properties and relations between entities that realy exist for a discourse domain in particular. It is a practical application of the philosophical ontology, a taxonomy. It catalogs the required variables for some set of computation and stablish the relations between them. Ontologies are created to limítate the complexity and to organize the information. It can be then applied to solve problems. Wikidata is a free data base, colaborative and multiligual, which works as a secondary data base and that collect structural data to give support to Wikipedia, Wikimedia Commons, and other wikis and every people in the world. That is why, queries are realized to obtain information from this and are able to solve problems. This obtained information can be used to analyze data and find conclusions. In this project it was used SPARQL queries requested to Wikidata to obtain information from the data and are able to generate what is called an ontology diagram. To do that, it was used algorithms to obtain instances, properties, labels, etc. to generate an ontology diagram following a process from a class and an input language. This project is useful because the ontological department of the Universidad Politécnica de Madrid needs an automatic ontology diagrams generator to make their work easier. To do this project it was used the Python programming language and it was studied the Orthogonal Layoout Algorithm to generate this diagram from a class and an input language. This algorithm was not effective because it was not found enough information and the algorithm was finally designed by the author of this project. The process or designed algorithm to reach the goal has been: first, the installation and importation of libraries, then the inputs with questions to the user to obtain the input values, then the instances obtaining of the entry class, la properties obtaining, the list that relates the properties with the classes, the generation of a list with several classes and one property and other with several properties and one class, then the properties and classes are labeled and the data properties are obtained to be introduced in the initial box. Into this last section, some properties are discarded which we do not want to analyze, the data properties are obtained not labeled, a list is created with the numer of instances for property, they are sorted and the six first values are labeled. The last point is the generation of the .XML file which could be open from draw.io and the resultant final diagram will be able to be watched.

More information

Item ID: 66423
DC Identifier: https://oa.upm.es/66423/
OAI Identifier: oai:oa.upm.es:66423
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 16 Mar 2021 08:21
Last Modified: 16 Mar 2021 08:21
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM