Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview |
García Sogo, Javier (2015). Medida de distancia semántica en grafos UNL. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).
Title: | Medida de distancia semántica en grafos UNL |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Thesis (Master thesis) |
Masters title: | Inteligencia Artificial |
Date: | July 2015 |
Subjects: | |
Faculty: | E.T.S. de Ingenieros Informáticos (UPM) |
Department: | Inteligencia Artificial |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview |
El trabajo que se presenta a continuación desarrolla un modelo para calcular la
distancia semántica entre dos oraciones representadas por grafos UNL. Este problema
se plantea en el contexto de la traducción automática donde diferentes traductores
pueden generar oraciones ligeramente diferentes partiendo del mismo
original. La medida de distancia que se propone tiene como objetivo proporcionar
una evaluación objetiva sobre la calidad del proceso de generación del texto.
El autor realiza una exploración del estado del arte sobre esta materia, reuniendo
en un único trabajo los modelos propuestos de distancia semántica entre conceptos,
los modelos de comparación de grafos y las pocas propuestas realizadas para
calcular distancias entre grafos conceptuales. También evalúa los pocos recursos
disponibles para poder experimentar el modelo y plantea una metodología para
generar los conjuntos de datos que permitirían aplicar la propuesta con el rigor
científico necesario y desarrollar la experimentación.
Utilizando las piezas anteriores se propone un modelo novedoso de comparación
entre grafos conceptuales que permite utilizar diferentes algoritmos de distancia
entre conceptos y establecer umbrales de tolerancia para permitir una comparación
flexible entre las oraciones.
Este modelo se programa utilizando C++, se alimenta con los recursos a los que se
ha hecho referencia anteriormente, y se experimenta con un conjunto de oraciones
creado por el autor ante la falta de otros recursos disponibles.
Los resultados del modelo muestran que la metodología y la implementación pueden
conducir a la obtención de una medida de distancia entre grafos UNL con
aplicación en sistemas de traducción automática, sin embargo, la carencia de recursos
y de datos etiquetados con los que validar el algoritmo requieren un esfuerzo
previo importante antes de poder ofrecer resultados concluyentes.---ABSTRACT---The work presented here develops a model to calculate the semantic distance between
two sentences represented by their UNL graphs. This problem arises in the
context of machine translation where different translators can generate slightly
different sentences from the same original. The distance measure that is proposed
aims to provide an objective evaluation on the quality of the process involved in
the generation of text.
The author carries out an exploration of the state of the art on this subject, bringing
together in a single work the proposed models of semantic distance between concepts,
models for comparison of graphs and the few proposals made to calculate
distances between conceptual graphs. It also assesses the few resources available
to experience the model and presents a methodology to generate the datasets that
would be needed to develop the proposal with the scientific rigor required and to
carry out the experimentation.
Using the previous parts a new model is proposed to compute differences between
conceptual graphs; this model allows the use of different algorithms of distance
between concepts and is parametrized in order to be able to perform a flexible
comparison between the resulting sentences.
This model is implemented in C++ programming language, it is powered with the
resources referenced above and is experienced with a set of sentences created by
the author due to the lack of other available resources.
The results of the model show that the methodology and the implementation can
lead to the achievement of a measure of distance between UNL graphs with application
in machine translation systems, however, lack of resources and of labeled
data to validate the algorithm requires an important effort to be done first in order
to be able to provide conclusive results.
Item ID: | 37433 |
---|---|
DC Identifier: | https://oa.upm.es/37433/ |
OAI Identifier: | oai:oa.upm.es:37433 |
Deposited by: | Biblioteca Facultad de Informatica |
Deposited on: | 03 Sep 2015 07:13 |
Last Modified: | 03 Sep 2015 07:13 |