Back to Search Start Over

An Empirical Analysis of Data Selection Techniques in Statistical Machine Translation

Authors :
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
European Commission
Generalitat Valenciana
Chinea Ríos, Mara
Sanchis Trilles, Germán
Casacuberta Nolla, Francisco
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
European Commission
Generalitat Valenciana
Chinea Ríos, Mara
Sanchis Trilles, Germán
Casacuberta Nolla, Francisco
Publication Year :
2015

Abstract

[EN] Domain adaptation has recently gained interest in statistical machine translation. One of the adaptation techniques is based in the selection data. Data selection aims to select the best subset of the bilingual sentences from an available pool of sentences, with which to train a SMT system. In this paper, we study how affect the bilingual corpora used for the data selection methods in the translation quality<br />[ES] La adaptación de dominios genera mucho interés dentro de la traducción automática estadística. Una de las técnicas de adaptaciión esta basada en la selecciión de datos que tiene como objetivo seleccionar el mejor subconjunto de oraciones bilingües de un gran conjunto de oraciones. En este artículo estudiamos como afectan los corpus bilingües empleados por los métodos de selección de frases en la calidad de las traducciones.

Details

Database :
OAIster
Notes :
TEXT, English
Publication Type :
Electronic Resource
Accession number :
edsoai.on1138300078
Document Type :
Electronic Resource