Enabling support for complex questions in knowledge-graph question-answering systems by decomposition

Liu Chen, Teng (2023). Enabling support for complex questions in knowledge-graph question-answering systems by decomposition. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Enabling support for complex questions in knowledge-graph question-answering systems by decomposition
Author/s:
  • Liu Chen, Teng
Contributor/s:
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2023
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFM_TENG_LIU_CHEN.pdf] PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (569kB)

Abstract

La tarea de question-answering (QA) en el procesamiento del lenguaje natural (NLP) se enfoca en crear sistemas informáticos que comprendan y respondan con precisión a consultas formuladas en lenguaje cotidiano. Estos sistemas emplean algoritmos avanzados para analizar preguntas, buscar en diversas fuentes y generar respuestas concisas y relevantes. QA facilita la comunicación intuitiva entre humanos y máquinas y mejora la recuperación de información. Las preguntas de un solo salto o simples se pueden responder directamente desde una sola fuente de información, mientras que las preguntas de varios saltos o complejas requieren información de múltiples fuentes. Las preguntas de varios saltos implican un razonamiento complejo, la comprensión de relaciones y la conexión de diferentes piezas de información, lo que las hace más desafiantes. Responder a ellas implica identificar información relevante, razonar y navegar por la ambigüedad, lo que supone un desafío para los sistemas de QA. Los sistemas de QA basados en Grafos de Conocimiento (KGQA) aprovechan grafos de conocimiento estructurados, que capturan atributos y relaciones de entidades, para proporcionar respuestas contextualmente apropiadas. MuHeQA es un algoritmo innovador de Preguntas y Respuestas basado en Grafos de Conocimiento (KGQA), como se describe en el trabajo de Badenes-Olmedo and Corcho (2023). Aborda las limitaciones comúnmente encontradas en los sistemas KGQA mediante la introducción de un enfoque único que opera simultáneamente en múltiples grafos de conocimiento, integrando de manera fluida fuentes de datos estructurados y no estructurados. Cabe destacar que MuHeQA se destaca por su independencia de dominio, ya que no se basa en datos de entrenamiento, lo que le permite adaptarse a diversos dominios sin necesidad de un entrenamiento específico extenso. Además, reduce la dependencia del esquema subyacente, ya que no navega a través de contenido estructurado, sino que se enfoca en leer los valores de las propiedades. Sin embargo, es importante tener en cuenta que MuHeQA actualmente enfrenta desafíos relacionados con la inferencia de un solo contexto, lo que puede dificultar su efectividad para manejar preguntas complejas. Para superar esta limitación, este proyecto tiene como objetivo mejorar MuHeQA mediante el aprovechamiento de técnicas de descomposición de preguntas, lo que le permite abordar preguntas complejas dividiéndolas en subpreguntas más simples y extrayendo respuestas de manera efectiva de los grafos de conocimiento.

ABSTRACT

The task of Question-answering (QA) in natural language processing (NLP) focuses on creating computer systems that understand and accurately respond to everyday language queries. These systems employ advanced algorithms to analyze questions, search diverse sources, and generate concise, relevant answers. QA facilitates intuitive human-machine communication and enhances information retrieval. Single-hop and multi-hop questions are used in natural language processing and information retrieval. Single-hop or simple questions can be answered directly from one source, while multi-hop or complex questions require information from multiple sources. Multi-hop questions involve complex reasoning, understanding relationships, and connecting different information pieces, making them more challenging. Answering them involves identifying relevant information, reasoning, and navigating ambiguity, presenting a challenge for QA systems. Knowledge Graph Question Answering (KGQA) systems leverage structured knowledge graphs, capturing entity attributes and relationships, to provide contextually appropriate responses. MuHeQA is an innovative Knowledge Graph-based Question Answering (KGQA) algorithm, as described in the work by Badenes-Olmedo and Corcho (2023). It addresses limitations commonly found in KGQA systems by introducing a unique approach that operates simultaneously on multiple knowledge graphs, seamlessly integrating structured and unstructured data sources. Notably, MuHeQA stands out for its domainindependence, as it does not rely on training data, making it adaptable to various domains without the need for extensive domain-specific training. Moreover, it reduces dependency on the underlying schema, as it does not navigate through structured content but instead focuses on reading property values. However, it is important to note that MuHeQA currently faces challenges related to single-context inference, which can hinder its effectiveness in handling complex questions. To overcome this limitation, this project aims to enhance MuHeQA by leveraging question decomposition techniques, enabling it to tackle complex questions by breaking them down into simpler sub-questions and effectively extracting answers from the knowledge graphs.

More information

Item ID: 75858
DC Identifier: https://oa.upm.es/75858/
OAI Identifier: oai:oa.upm.es:75858
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 14 Sep 2023 09:06
Last Modified: 14 Sep 2023 09:06
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM