Apr, 2020

基于词典的跨领域神经机器翻译数据增强

TL;DR本文提出了一种基于词典的数据增强方法,用于跨领域神经机器翻译。通过生成大规模的伪 IND 平行语料库,可以增强一般域训练的基线 NMT 模型,实验结果表明,DDA 增强的 NMT 模型表现出一致显著的改进,胜过基线模型 3.75-11.53 BLEU。