Sentence selection for improving the tuning process of a statistical machine translation system

Lopez Ludeña, Veronica; San Segundo Hernández, Rubén; Montero Martínez, Juan Manuel y Lorenzo Trueba, Jaime (2012). Sentence selection for improving the tuning process of a statistical machine translation system. "Procesamiento de Lenguaje Natural", v. 2012 (n. 48); pp. 51-56. ISSN 1135-5948.

Descripción

Título: Sentence selection for improving the tuning process of a statistical machine translation system
Autor/es:
  • Lopez Ludeña, Veronica
  • San Segundo Hernández, Rubén
  • Montero Martínez, Juan Manuel
  • Lorenzo Trueba, Jaime
Tipo de Documento: Artículo
Título de Revista/Publicación: Procesamiento de Lenguaje Natural
Fecha: Marzo 2012
Volumen: 2012
Materias:
Palabras Clave Informales: Traducción estadística, selección de corpus, traducción basada en subfrases, traducción español-inglés, ajuste de pesos.
Escuela: E.T.S.I. Telecomunicación (UPM)
Departamento: Ingeniería Electrónica
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (694kB) | Vista Previa

Resumen

Este artículo describe una estrategia de selección de frases para hacer el ajuste de un sistema de traducción estadístico basado en el decodificador Moses que traduce del español al inglés. En este trabajo proponemos dos posibilidades para realizar esta selección de las frases del corpus de validación que más se parecen a las frases que queremos traducir (frases de test en lengua origen). Con esta selección podemos obtener unos mejores pesos de los modelos para emplearlos después en el proceso de traducción y, por tanto, mejorar los resultados. Concretamente, con el método de selección basado en la medida de similitud propuesta en este artículo, mejoramos la medida BLEU del 27,17% con el corpus de validación completo al 27,27% seleccionando las frases para el ajuste. Estos resultados se acercan a los del experimento ORACLE: se utilizan las mismas frases de test para hacer el ajuste de los pesos. En este caso, el BLEU obtenido es de 27,51%.

Más información

ID de Registro: 16475
Identificador DC: http://oa.upm.es/16475/
Identificador OAI: oai:oa.upm.es:16475
URL Oficial: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4487
Depositado por: Memoria Investigacion
Depositado el: 17 Jul 2013 16:48
Ultima Modificación: 21 Abr 2016 16:46
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM