MMFeb, 2017

通过将多种语言源句子串联实现多源神经机器翻译

TL;DR本文提出了一种简单的多源神经机器翻译解决方案 —— 通过预处理 N 路多语种语料库,将源语言句子连接成一个长的多源输入句子,不修改神经机器翻译(NMT)架构或训练过程,使用预处理的语料库训练 NMT 系统,实验结果表明该方法在资源匮乏和资源丰富情况下均有效(使用 2 种源语言可达到 4 BLEU,使用 5 种源语言可达到 6 BLEU),同时与现有的 MSNMT 方法进行比较,表明我们的方法尽管简单却具有竞争力的结果。我们还通过可视化关注力提供了一些多语言信息的见解。