Sentence selection for improving the tuning process of a statistical machine translation system

Lopez Ludeña, Veronica and San Segundo Hernández, Rubén and Montero Martínez, Juan Manuel and Lorenzo Trueba, Jaime (2012). Sentence selection for improving the tuning process of a statistical machine translation system. "Procesamiento de Lenguaje Natural", v. 2012 (n. 48); pp. 51-56. ISSN 1135-5948.

Description

Title: Sentence selection for improving the tuning process of a statistical machine translation system
Author/s:
  • Lopez Ludeña, Veronica
  • San Segundo Hernández, Rubén
  • Montero Martínez, Juan Manuel
  • Lorenzo Trueba, Jaime
Item Type: Article
Título de Revista/Publicación: Procesamiento de Lenguaje Natural
Date: March 2012
ISSN: 1135-5948
Volume: 2012
Subjects:
Freetext Keywords: Traducción estadística, selección de corpus, traducción basada en subfrases, traducción español-inglés, ajuste de pesos.
Faculty: E.T.S.I. Telecomunicación (UPM)
Department: Ingeniería Electrónica
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (694kB) | Preview

Abstract

Este artículo describe una estrategia de selección de frases para hacer el ajuste de un sistema de traducción estadístico basado en el decodificador Moses que traduce del español al inglés. En este trabajo proponemos dos posibilidades para realizar esta selección de las frases del corpus de validación que más se parecen a las frases que queremos traducir (frases de test en lengua origen). Con esta selección podemos obtener unos mejores pesos de los modelos para emplearlos después en el proceso de traducción y, por tanto, mejorar los resultados. Concretamente, con el método de selección basado en la medida de similitud propuesta en este artículo, mejoramos la medida BLEU del 27,17% con el corpus de validación completo al 27,27% seleccionando las frases para el ajuste. Estos resultados se acercan a los del experimento ORACLE: se utilizan las mismas frases de test para hacer el ajuste de los pesos. En este caso, el BLEU obtenido es de 27,51%.

More information

Item ID: 16475
DC Identifier: http://oa.upm.es/16475/
OAI Identifier: oai:oa.upm.es:16475
Official URL: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4487
Deposited by: Memoria Investigacion
Deposited on: 17 Jul 2013 16:48
Last Modified: 21 Apr 2016 16:46
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM