Apr, 2020
基于词典的跨领域神经机器翻译数据增强
Dictionary-based Data Augmentation for Cross-Domain Neural Machine Translation
Wei Peng, Chongxuan Huang, Tianhao Li, Yun Chen, Qun Liu
TL;DR本文提出了一种基于词典的数据增强方法,用于跨领域神经机器翻译。通过生成大规模的伪 IND 平行语料库,可以增强一般域训练的基线 NMT 模型,实验结果表明,DDA 增强的 NMT 模型表现出一致显著的改进,胜过基线模型 3.75-11.53 BLEU。