Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (8MB) | Preview |
Navas Loro, María ORCID: https://orcid.org/0000-0003-1011-5023
(2016).
Modelo de paráfrasis semántica de similitud de documentos.
Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).
Title: | Modelo de paráfrasis semántica de similitud de documentos |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Thesis (Master thesis) |
Masters title: | Inteligencia Artificial |
Date: | July 2016 |
Subjects: | |
Faculty: | E.T.S. de Ingenieros Informáticos (UPM) |
Department: | Inteligencia Artificial |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (8MB) | Preview |
Treatment of paraphrasing is an understudied area of Natural Language Processing. Most related eforts have focused on the study of purely semantic similarity, oriented to tasks such as text categorization, leaving aside the study of the content of the text, of what it does really mean. The fact that the main approaches to the treatment of paraphrasing are limited either to related areas such as logic or to purely theoretical linguistic models with dificult and costly practical application make this phenomenon not to be properly covered nowadays, being still impossible to tell whether two texts say exactly the same despite being expressed in diferent ways. Existing approaches also tend to be oriented to a unique language, so their scope is even more limited, preventing them for instance from certifying if a translation is correct or not. This thesis aims to remove this obstacle by approaching paraphrasing from a multilingual point of view, basing the presented model on an interlingual representation that allows it to study paraphrased texts that can come from any language. This representation will also help to avoid other common obstacles in Natural Language Understanding, such as the ambiguity problem. Therefore we introduce a model based on a novel approach, language independent, along with an extensive State of the Art on the areas involved in the treatment of paraphrasing.---ABSTRACT---El tratamiento de la paráfrasis es un área poco estudiada del Procesamiento del Lenguaje Natural. La mayoría de esfuerzos relacionados se han centrado en el estudio de la similaridad puramente semántica, orientada a tareas como la categorizaci ón de textos, dejando a un lado el estudio del contenido del texto, de qué quiere decir realmente. El hecho además de que los principales enfoques del tratamiento de la paráfrasis se limiten o bien a áreas relacionadas como la lógica o bien a modelos lingüísticos puramente teóricos de difícil y costosa aplicación práctica hacen que este fenómeno no esté a día de hoy debidamente cubierto, siendo imposible asegurar si dos textos dicen lo mismo pese a estar expresados de diferente manera. Las aproximaciones existentes suelen además estar orientadas a una única lengua, por lo que su alcance es aún más limitado, impidiendo por ejemplo certificar si una traducción es correcta o no. En esta tesis se pretende eliminar esta traba abordando la paráfrasis desde un punto de vista multilingüe, basándose en una representación interlingual que permitirá al modelo presentado estudiar la paráfrasis en textos que pueden proceder de cualquier idioma. Esta representación servirá también para evitar otros obstáculos habituales en la Comprensión del Lenguaje Natural, como es el problema de la ambigüedad. Presentaremos por tanto un modelo basado en un enfoque novedoso, independiente de la lengua, acompañado además de un extenso Estado del Arte sobre las áreas involucradas en el tratamiento de la paráfrasis.
Item ID: | 43048 |
---|---|
DC Identifier: | https://oa.upm.es/43048/ |
OAI Identifier: | oai:oa.upm.es:43048 |
Deposited by: | Biblioteca Facultad de Informatica |
Deposited on: | 28 Jul 2016 08:50 |
Last Modified: | 28 Jul 2016 08:50 |