ACLNov, 2017

使用连续缓存学习记忆翻译历史

TL;DR本文研究了如何利用一种轻量级的缓存神经网络来存储最近的隐藏层表示作为翻译历史,基于从记忆中检索出的翻译历史更新生成单词的概率分布,从而使得神经机器翻译模型具有动态适应能力,并且在计算成本方面影响极小。