Oct, 2018

大词汇神经网络快速 Softmax 推理的筛选学习

TL;DR在本文中,我们介绍了一种利用上下文向量的聚类结构的软最大似然层逼近算法,在移动设备上比传统方法具有更快的推理速度。我们使用 Gumbel softmax 对筛选模型进行端到端训练,通过在各种 NLP 任务中对前 k 个单词进行预测,实现了一个数量级更快的推理速度,例如在德语到英语的机器翻译任务中,与现有先进技术相比,我们实现了 20.4 倍的加速。