ICLRFeb, 2019

软分离编码的多语言神经机器翻译

TL;DR本研究提出了一种名为 SDE 的多语言词典编码框架,通过字符编码和语义嵌入空间的共享来实现智能共享词汇级别信息,从而实现在低资源语言中神经机器翻译系统的多语言训练。在标准数据集上的实验表明,与强大的多语言神经机器翻译基线相比,本方法在四种低资源语言中表现出一贯的提高,并在其中一种测试语言上获得了 2 BLEU 的增益,并在所有四种语言对中实现了新的最优状态。