Oct, 2023

关于后向翻译的合成数据

TL;DR通过理论和实证研究,我们确定了合成数据对回译神经机器翻译(NMT)性能的两个关键因素,即质量和重要性。基于我们的发现,我们提出了一种简单而有效的方法来生成合成数据,以更好地权衡这两个因素,从而为回译提供更好的性能。通过在 WMT14 的基准任务中运行广泛的实验,我们的回译模型显著优于标准的回译基线方法,证明了我们提出方法的有效性。