ACLApr, 2017

通过二进制代码预测的神经机器翻译

TL;DR本文提出了一种新的神经机器翻译系统输出层计算方法,基于预测每个单词的二进制码,可以在最佳情况下将输出层的计算时间 / 内存需求缩小到对数级别。此外,本文还介绍了使用纠错码和结合 softmax 和二进制码来提高鲁棒性的两种高级方法。两个英日双向翻译实验表明,所提出的模型在接近 softmax 的 BLEU 分数的同时,将内存使用率降低到不到 1/10,CPU 解码速度提高了 5 到 10 倍。