Razonamiento automático sobre bases de conocimiento mediante Deep Learning

Amador Domínguez, Elvira ORCID: https://orcid.org/0000-0001-6838-1266 (2018). Razonamiento automático sobre bases de conocimiento mediante Deep Learning. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Razonamiento automático sobre bases de conocimiento mediante Deep Learning
Author/s:
Contributor/s:
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: 2018
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFM_ELVIRA_AMADOR_DOMINGUEZ.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

La representación del conocimiento es una de las principales áreas de estudio
dentro de la Inteligencia Articial. Una forma de modelización son las bases de
conocimiento (Knowledge Bases o KB), tales como WordNet o Freebase, que dio
lugar a la creación del Google Knowledge Graph. Estos modelos de conocimiento
permiten llevar a cabo un gran número de tareas, entre las cuales, una de las más
interesantes es la posibilidad de devolver respuestas inteligentes y personalizadas a
preguntas específicas, gracias al razonamiento semántico realizado sobre las mismas.
Sin embargo, estos modelos presentan un gran problema: están incompletos.
Para solucionar este problema, ha habido un interés creciente en el Statistical
Relational Learning (SRL), o Aprendizaje Estadístico Relacional, el cual permite,
por ejemplo, emplear técnicas de aprendizaje automático para llevar a cabo razonamiento
sobre datos relacionales. En este trabajo, se propone un método que combina
técnicas de este tipo con una de las formas de representación del conocimiento más
tradicionales de la Inteligencia Artificial: las ontologías. Con la introducción de informaci
ón ontológica explícita, se espera que el modelo de razonamiento no solo mejore
su capacidad predictiva sino que, incluso, sea capaz de llevar a cabo inferencias sobre
datos no existentes previamente en la base de conocimiento.
De acuerdo con el método propuesto, una entidad puede ser contextualizada por
medio de la jerarquía de clases que la representa en una ontología, lo que, indirectamente,
permite al modelo predictivo inferir restricciones acerca de las relaciones
basadas en esta información, determinando así qué tipos de entidades componen
un hecho en una relación dada. En este trabajo, se plantea el uso de este método
aplicado al problema específico de predicción de tripletas, es decir, dado un hecho
compuesto por dos entidades y la relación que las une, se busca determinar si éste
es es, o no, factible.
Para probar esta hipótesis y, tras realizar una revisión de los trabajos científicos
en la literatura especializada, se selecciona un modelo ya existente de razonamiento
sobre bases de conocimiento: la red de neuronas tensorial. En primer lugar, se realizan
una serie de experimentos destinados a comprobar la capacidad predictiva del
modelo para, a continuación, llevar a cabo una experimentación pormenorizada en
la que se combina este modelo con el método de introducción ontológica propuesto.
Tras la experimentación, se comprueba que la inclusión de este tipo de conocimiento
a la hora de llevar a cabo las predicciones reporta una mejora sensible en los resultados,
permitiendo, además, razonar sobre hechos en los que se incluyen entidades
nuevas no observadas en fase de entrenamiento.---ABSTRACT---Knowledge representation is one of the main areas of focus inside Artificial Intelligence.
Knowledge Bases are a particular way of knowledge modelling, and WordNet
and Freebase are examples of it. This last one served as base for the generation of
the Google Knowledge Graph. These models are able to perform a large number of
tasks, and one of the most relevant ones is the possibility of obtaining personalized
and intelligent answers for specific questions through intelligent reasoning. However,
these models have a great downside: they are incomplete.
To solve these existing dificulties, there has been a growing interest in Statistical
Relational Data (SRL), which allows, for example, the use of machine learning
techniques to reason over relational data. In this work, we propose a method that
combines these recent techniques with one of the most tradicional knowledge representation
models in Artificial Intelligence: ontologies. With the introduction of
explicit ontological information, we expect the model not only to improve its predictive
capability, but also to even be able to perform reasoning over data previously
non-existent on the knowledge base.
According to the method proposed in this work, an entity can be contextualized
by means of the class hierarchy that represents the entity in an ontology, what
indirectly allows the model to infer restrictions about the relations based on this
information, determining which types of entities form a fact for a certain relation.
This work is focused on the application of this method for the specific problem of
triple prediction in which, given a fact composed by two entities and the relation
that joins them, the goal is to predict whether this fact is feasible or not.
To prove this hypothesis and, after performing a highly detailed study of the
avalible methods, we decide to use the neural tensor network as the reasoning model.
First of all, we replicate the results reported for the neural tensor network in order
to prove the reasoning capability of the model and, after that, we conduct a series
of experiments where we combine the original model with the proposed method of
introduction of ontological information. After this experimentation, the results show
that the inclusion of this kind of knowledge on the predictive model induces a little
improvement on the results, as well as enabling reasoning over facts that include
new entities that have not been previously seen by the model during the training
phase.

More information

Item ID: 51628
DC Identifier: https://oa.upm.es/51628/
OAI Identifier: oai:oa.upm.es:51628
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 13 Jul 2018 11:32
Last Modified: 13 Jul 2018 11:33
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM