Razonamiento automático sobre bases de conocimiento mediante Deep Learning

Amador Domínguez, Elvira (2018). Razonamiento automático sobre bases de conocimiento mediante Deep Learning. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Razonamiento automático sobre bases de conocimiento mediante Deep Learning
Author/s:
  • Amador Domínguez, Elvira
Contributor/s:
  • Serrano Fernández, Emilio
  • Manrique Gamo, Daniel
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: 2018
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

La representación del conocimiento es una de las principales áreas de estudio dentro de la Inteligencia Articial. Una forma de modelización son las bases de conocimiento (Knowledge Bases o KB), tales como WordNet o Freebase, que dio lugar a la creación del Google Knowledge Graph. Estos modelos de conocimiento permiten llevar a cabo un gran número de tareas, entre las cuales, una de las más interesantes es la posibilidad de devolver respuestas inteligentes y personalizadas a preguntas específicas, gracias al razonamiento semántico realizado sobre las mismas. Sin embargo, estos modelos presentan un gran problema: están incompletos. Para solucionar este problema, ha habido un interés creciente en el Statistical Relational Learning (SRL), o Aprendizaje Estadístico Relacional, el cual permite, por ejemplo, emplear técnicas de aprendizaje automático para llevar a cabo razonamiento sobre datos relacionales. En este trabajo, se propone un método que combina técnicas de este tipo con una de las formas de representación del conocimiento más tradicionales de la Inteligencia Artificial: las ontologías. Con la introducción de informaci ón ontológica explícita, se espera que el modelo de razonamiento no solo mejore su capacidad predictiva sino que, incluso, sea capaz de llevar a cabo inferencias sobre datos no existentes previamente en la base de conocimiento. De acuerdo con el método propuesto, una entidad puede ser contextualizada por medio de la jerarquía de clases que la representa en una ontología, lo que, indirectamente, permite al modelo predictivo inferir restricciones acerca de las relaciones basadas en esta información, determinando así qué tipos de entidades componen un hecho en una relación dada. En este trabajo, se plantea el uso de este método aplicado al problema específico de predicción de tripletas, es decir, dado un hecho compuesto por dos entidades y la relación que las une, se busca determinar si éste es es, o no, factible. Para probar esta hipótesis y, tras realizar una revisión de los trabajos científicos en la literatura especializada, se selecciona un modelo ya existente de razonamiento sobre bases de conocimiento: la red de neuronas tensorial. En primer lugar, se realizan una serie de experimentos destinados a comprobar la capacidad predictiva del modelo para, a continuación, llevar a cabo una experimentación pormenorizada en la que se combina este modelo con el método de introducción ontológica propuesto. Tras la experimentación, se comprueba que la inclusión de este tipo de conocimiento a la hora de llevar a cabo las predicciones reporta una mejora sensible en los resultados, permitiendo, además, razonar sobre hechos en los que se incluyen entidades nuevas no observadas en fase de entrenamiento.---ABSTRACT---Knowledge representation is one of the main areas of focus inside Artificial Intelligence. Knowledge Bases are a particular way of knowledge modelling, and WordNet and Freebase are examples of it. This last one served as base for the generation of the Google Knowledge Graph. These models are able to perform a large number of tasks, and one of the most relevant ones is the possibility of obtaining personalized and intelligent answers for specific questions through intelligent reasoning. However, these models have a great downside: they are incomplete. To solve these existing dificulties, there has been a growing interest in Statistical Relational Data (SRL), which allows, for example, the use of machine learning techniques to reason over relational data. In this work, we propose a method that combines these recent techniques with one of the most tradicional knowledge representation models in Artificial Intelligence: ontologies. With the introduction of explicit ontological information, we expect the model not only to improve its predictive capability, but also to even be able to perform reasoning over data previously non-existent on the knowledge base. According to the method proposed in this work, an entity can be contextualized by means of the class hierarchy that represents the entity in an ontology, what indirectly allows the model to infer restrictions about the relations based on this information, determining which types of entities form a fact for a certain relation. This work is focused on the application of this method for the specific problem of triple prediction in which, given a fact composed by two entities and the relation that joins them, the goal is to predict whether this fact is feasible or not. To prove this hypothesis and, after performing a highly detailed study of the avalible methods, we decide to use the neural tensor network as the reasoning model. First of all, we replicate the results reported for the neural tensor network in order to prove the reasoning capability of the model and, after that, we conduct a series of experiments where we combine the original model with the proposed method of introduction of ontological information. After this experimentation, the results show that the inclusion of this kind of knowledge on the predictive model induces a little improvement on the results, as well as enabling reasoning over facts that include new entities that have not been previously seen by the model during the training phase.

More information

Item ID: 51628
DC Identifier: http://oa.upm.es/51628/
OAI Identifier: oai:oa.upm.es:51628
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 13 Jul 2018 11:32
Last Modified: 13 Jul 2018 11:33
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM