Medida de distancia semántica en grafos UNL

García Sogo, Javier (2015). Medida de distancia semántica en grafos UNL. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Medida de distancia semántica en grafos UNL
Author/s:
  • García Sogo, Javier
Contributor/s:
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2015
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TM_GARCIA_SOGO_JAVIER.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview

Abstract

El trabajo que se presenta a continuación desarrolla un modelo para calcular la
distancia semántica entre dos oraciones representadas por grafos UNL. Este problema
se plantea en el contexto de la traducción automática donde diferentes traductores
pueden generar oraciones ligeramente diferentes partiendo del mismo
original. La medida de distancia que se propone tiene como objetivo proporcionar
una evaluación objetiva sobre la calidad del proceso de generación del texto.
El autor realiza una exploración del estado del arte sobre esta materia, reuniendo
en un único trabajo los modelos propuestos de distancia semántica entre conceptos,
los modelos de comparación de grafos y las pocas propuestas realizadas para
calcular distancias entre grafos conceptuales. También evalúa los pocos recursos
disponibles para poder experimentar el modelo y plantea una metodología para
generar los conjuntos de datos que permitirían aplicar la propuesta con el rigor
científico necesario y desarrollar la experimentación.
Utilizando las piezas anteriores se propone un modelo novedoso de comparación
entre grafos conceptuales que permite utilizar diferentes algoritmos de distancia
entre conceptos y establecer umbrales de tolerancia para permitir una comparación
flexible entre las oraciones.
Este modelo se programa utilizando C++, se alimenta con los recursos a los que se
ha hecho referencia anteriormente, y se experimenta con un conjunto de oraciones
creado por el autor ante la falta de otros recursos disponibles.
Los resultados del modelo muestran que la metodología y la implementación pueden
conducir a la obtención de una medida de distancia entre grafos UNL con
aplicación en sistemas de traducción automática, sin embargo, la carencia de recursos
y de datos etiquetados con los que validar el algoritmo requieren un esfuerzo
previo importante antes de poder ofrecer resultados concluyentes.---ABSTRACT---The work presented here develops a model to calculate the semantic distance between
two sentences represented by their UNL graphs. This problem arises in the
context of machine translation where different translators can generate slightly
different sentences from the same original. The distance measure that is proposed
aims to provide an objective evaluation on the quality of the process involved in
the generation of text.
The author carries out an exploration of the state of the art on this subject, bringing
together in a single work the proposed models of semantic distance between concepts,
models for comparison of graphs and the few proposals made to calculate
distances between conceptual graphs. It also assesses the few resources available
to experience the model and presents a methodology to generate the datasets that
would be needed to develop the proposal with the scientific rigor required and to
carry out the experimentation.
Using the previous parts a new model is proposed to compute differences between
conceptual graphs; this model allows the use of different algorithms of distance
between concepts and is parametrized in order to be able to perform a flexible
comparison between the resulting sentences.
This model is implemented in C++ programming language, it is powered with the
resources referenced above and is experienced with a set of sentences created by
the author due to the lack of other available resources.
The results of the model show that the methodology and the implementation can
lead to the achievement of a measure of distance between UNL graphs with application
in machine translation systems, however, lack of resources and of labeled
data to validate the algorithm requires an important effort to be done first in order
to be able to provide conclusive results.

More information

Item ID: 37433
DC Identifier: https://oa.upm.es/37433/
OAI Identifier: oai:oa.upm.es:37433
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 03 Sep 2015 07:13
Last Modified: 03 Sep 2015 07:13
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM