Razonamiento automático sobre bases de conocimiento mediante Deep Learning

Amador Domínguez, Elvira (2018). Razonamiento automático sobre bases de conocimiento mediante Deep Learning. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título: Razonamiento automático sobre bases de conocimiento mediante Deep Learning
Autor/es:
  • Amador Domínguez, Elvira
Director/es:
  • Serrano Fernández, Emilio
  • Manrique Gamo, Daniel
Tipo de Documento: Tesis (Master)
Título del máster: Inteligencia Artificial
Fecha: 2018
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB) | Vista Previa

Resumen

La representación del conocimiento es una de las principales áreas de estudio dentro de la Inteligencia Articial. Una forma de modelización son las bases de conocimiento (Knowledge Bases o KB), tales como WordNet o Freebase, que dio lugar a la creación del Google Knowledge Graph. Estos modelos de conocimiento permiten llevar a cabo un gran número de tareas, entre las cuales, una de las más interesantes es la posibilidad de devolver respuestas inteligentes y personalizadas a preguntas específicas, gracias al razonamiento semántico realizado sobre las mismas. Sin embargo, estos modelos presentan un gran problema: están incompletos. Para solucionar este problema, ha habido un interés creciente en el Statistical Relational Learning (SRL), o Aprendizaje Estadístico Relacional, el cual permite, por ejemplo, emplear técnicas de aprendizaje automático para llevar a cabo razonamiento sobre datos relacionales. En este trabajo, se propone un método que combina técnicas de este tipo con una de las formas de representación del conocimiento más tradicionales de la Inteligencia Artificial: las ontologías. Con la introducción de informaci ón ontológica explícita, se espera que el modelo de razonamiento no solo mejore su capacidad predictiva sino que, incluso, sea capaz de llevar a cabo inferencias sobre datos no existentes previamente en la base de conocimiento. De acuerdo con el método propuesto, una entidad puede ser contextualizada por medio de la jerarquía de clases que la representa en una ontología, lo que, indirectamente, permite al modelo predictivo inferir restricciones acerca de las relaciones basadas en esta información, determinando así qué tipos de entidades componen un hecho en una relación dada. En este trabajo, se plantea el uso de este método aplicado al problema específico de predicción de tripletas, es decir, dado un hecho compuesto por dos entidades y la relación que las une, se busca determinar si éste es es, o no, factible. Para probar esta hipótesis y, tras realizar una revisión de los trabajos científicos en la literatura especializada, se selecciona un modelo ya existente de razonamiento sobre bases de conocimiento: la red de neuronas tensorial. En primer lugar, se realizan una serie de experimentos destinados a comprobar la capacidad predictiva del modelo para, a continuación, llevar a cabo una experimentación pormenorizada en la que se combina este modelo con el método de introducción ontológica propuesto. Tras la experimentación, se comprueba que la inclusión de este tipo de conocimiento a la hora de llevar a cabo las predicciones reporta una mejora sensible en los resultados, permitiendo, además, razonar sobre hechos en los que se incluyen entidades nuevas no observadas en fase de entrenamiento.---ABSTRACT---Knowledge representation is one of the main areas of focus inside Artificial Intelligence. Knowledge Bases are a particular way of knowledge modelling, and WordNet and Freebase are examples of it. This last one served as base for the generation of the Google Knowledge Graph. These models are able to perform a large number of tasks, and one of the most relevant ones is the possibility of obtaining personalized and intelligent answers for specific questions through intelligent reasoning. However, these models have a great downside: they are incomplete. To solve these existing dificulties, there has been a growing interest in Statistical Relational Data (SRL), which allows, for example, the use of machine learning techniques to reason over relational data. In this work, we propose a method that combines these recent techniques with one of the most tradicional knowledge representation models in Artificial Intelligence: ontologies. With the introduction of explicit ontological information, we expect the model not only to improve its predictive capability, but also to even be able to perform reasoning over data previously non-existent on the knowledge base. According to the method proposed in this work, an entity can be contextualized by means of the class hierarchy that represents the entity in an ontology, what indirectly allows the model to infer restrictions about the relations based on this information, determining which types of entities form a fact for a certain relation. This work is focused on the application of this method for the specific problem of triple prediction in which, given a fact composed by two entities and the relation that joins them, the goal is to predict whether this fact is feasible or not. To prove this hypothesis and, after performing a highly detailed study of the avalible methods, we decide to use the neural tensor network as the reasoning model. First of all, we replicate the results reported for the neural tensor network in order to prove the reasoning capability of the model and, after that, we conduct a series of experiments where we combine the original model with the proposed method of introduction of ontological information. After this experimentation, the results show that the inclusion of this kind of knowledge on the predictive model induces a little improvement on the results, as well as enabling reasoning over facts that include new entities that have not been previously seen by the model during the training phase.

Más información

ID de Registro: 51628
Identificador DC: http://oa.upm.es/51628/
Identificador OAI: oai:oa.upm.es:51628
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 13 Jul 2018 11:32
Ultima Modificación: 13 Jul 2018 11:33
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM