Detección automática de inconsistencias en esDBpedia

Fernández Rico, Víctor (2019). Detección automática de inconsistencias en esDBpedia. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Detección automática de inconsistencias en esDBpedia
Author/s:
  • Fernández Rico, Víctor
Contributor/s:
  • Corcho García, Óscar
  • Rico Almodóvar, Mariano
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: 2019
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

Con la llegada de la Web han surgido diferentes proyectos colaborativos orientados a recopilar todo el conocimiento humano, como la Wikipedia, que es editada en más de 294 idiomas de forma activa y gracias a las aportaciones altruistas de millones de colaboradores. Debido a la importancia que tienen estos datos, tanto en la cantidad como en la calidad, han surgido diferentes iniciativas orientadas a hacer accesible este conocimiento a las máquinas, en un formato que sea fácilmente procesable por ellas. Uno de los principales proyectos que ponen en formato de datos enlazados este conocimiento es DBpedia. Dicho proyecto sustenta la mayor parte de los datos extraídos en los infoboxes de Wikipedia, conocidos también como fichas. Éstas contienen información en un formato semiestructurado que es fácil de procesar para las máquinas. Sin embargo, para dotar de una semántica a dicha información es preciso alimentar al sistema con mappings, que permiten relacionar el texto de la infobox con su correspondiente conceptualización en una ontología. Dichos mappings deben ser creados manualmente por la comunidad de DBpedia que mantiene cada idioma. A pesar de todos los esfuerzos que se realizan para mantener estos mappings, la naturaleza manual hace que sea frecuente encontrarse con errores que reducen la calidad de los datos generados, haciéndolos así inconsistentes entre los distintos idiomas. En este trabajo se presenta una herramienta orientada a detectar inconsistencias entre los usos de las mismas propiedades de la ontología de DBpedia en diferentes idiomas, utilizando tanto los datos generados como la propia ontología. Con la ayuda de la comunidad, se alimentará un clasificador binario con datos previamente validados por ésta con el objetivo de construir un modelo capaz de ayudar a localizar aquellos mappings con una calidad menor para ser reparados.---ABSTRACT---With the arrival of the Web, different collaborative project arose to help in the gathering of all the human knowledge, as the Wikipedia, which is edited in more than 294 languages actively and thanks to the millions of collaborators. Due to the relevance of this data, both in quantity and quality, different initiatives had arisen to help computers in understanding this data using a format that is understandable by them. One of this main projects that produces linked data out of all this knowledge is DBpeda. This project obtains the most part of their data from Wikipedia infoboxes. These contains information on a semistructured format which is easy to process by machines. Nevertheless, in order to provide semantics to that information it is needed to feed the system with mappings, which allows relate the text from an infobox with the corresponding ontology’s conceptualization. Said mappings has to be built manually by the DBpedia chapter in charge of each language. In spite of all the efforts to maintain all of those mappings, the manual nature of them makes it prone to errors that reduce the quality of the data generated, making them inconsistent amongst other languages. In this work it is presented a tool oriented to detect inconsistencies on the usages of a same ontology properties in different DBpedia languages using both extracted data and the ontology. The community will help to validate this data in order to build a classifier with a model able to locate mappings that need to be fixed by the community.

More information

Item ID: 55976
DC Identifier: http://oa.upm.es/55976/
OAI Identifier: oai:oa.upm.es:55976
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 07 Aug 2019 04:56
Last Modified: 07 Aug 2019 04:56
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM