Jun, 2019

通过词表归纳进行神经机器翻译的领域适应

TL;DR本文提出了一种无监督的自适应方法,使用伪域内语料库通过微调预先训练的域外NMT模型,借助词典诱导提取域内词汇,并通过针对性的单语域内目标句子进行逐词反向翻译构建伪平行域内语料库,在20对自适应设置和两种模型架构的五个领域中,我们的方法始终显示出提高,而不需要使用任何域内平行句子,改进了未经过调整的模型高达14 BLEU和强反向翻译基线的最高2 BLEU。