Modelo de paráfrasis semántica de similitud de documentos

Navas Loro, María (2016). Modelo de paráfrasis semántica de similitud de documentos. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título: Modelo de paráfrasis semántica de similitud de documentos
Autor/es:
  • Navas Loro, María
Director/es:
  • Cardeñosa Lera, Jesús
Tipo de Documento: Tesis (Master)
Título del máster: Inteligencia Artificial
Fecha: Julio 2016
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (8MB) | Vista Previa

Resumen

Treatment of paraphrasing is an understudied area of Natural Language Processing. Most related eforts have focused on the study of purely semantic similarity, oriented to tasks such as text categorization, leaving aside the study of the content of the text, of what it does really mean. The fact that the main approaches to the treatment of paraphrasing are limited either to related areas such as logic or to purely theoretical linguistic models with dificult and costly practical application make this phenomenon not to be properly covered nowadays, being still impossible to tell whether two texts say exactly the same despite being expressed in diferent ways. Existing approaches also tend to be oriented to a unique language, so their scope is even more limited, preventing them for instance from certifying if a translation is correct or not. This thesis aims to remove this obstacle by approaching paraphrasing from a multilingual point of view, basing the presented model on an interlingual representation that allows it to study paraphrased texts that can come from any language. This representation will also help to avoid other common obstacles in Natural Language Understanding, such as the ambiguity problem. Therefore we introduce a model based on a novel approach, language independent, along with an extensive State of the Art on the areas involved in the treatment of paraphrasing.---ABSTRACT---El tratamiento de la paráfrasis es un área poco estudiada del Procesamiento del Lenguaje Natural. La mayoría de esfuerzos relacionados se han centrado en el estudio de la similaridad puramente semántica, orientada a tareas como la categorizaci ón de textos, dejando a un lado el estudio del contenido del texto, de qué quiere decir realmente. El hecho además de que los principales enfoques del tratamiento de la paráfrasis se limiten o bien a áreas relacionadas como la lógica o bien a modelos lingüísticos puramente teóricos de difícil y costosa aplicación práctica hacen que este fenómeno no esté a día de hoy debidamente cubierto, siendo imposible asegurar si dos textos dicen lo mismo pese a estar expresados de diferente manera. Las aproximaciones existentes suelen además estar orientadas a una única lengua, por lo que su alcance es aún más limitado, impidiendo por ejemplo certificar si una traducción es correcta o no. En esta tesis se pretende eliminar esta traba abordando la paráfrasis desde un punto de vista multilingüe, basándose en una representación interlingual que permitirá al modelo presentado estudiar la paráfrasis en textos que pueden proceder de cualquier idioma. Esta representación servirá también para evitar otros obstáculos habituales en la Comprensión del Lenguaje Natural, como es el problema de la ambigüedad. Presentaremos por tanto un modelo basado en un enfoque novedoso, independiente de la lengua, acompañado además de un extenso Estado del Arte sobre las áreas involucradas en el tratamiento de la paráfrasis.

Más información

ID de Registro: 43048
Identificador DC: http://oa.upm.es/43048/
Identificador OAI: oai:oa.upm.es:43048
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 28 Jul 2016 08:50
Ultima Modificación: 28 Jul 2016 08:50
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM