ACLMay, 2018

神经机器翻译的稀疏和约束注意力

TL;DR本文提出了一种新颖的方法来解决 NMT 中的 “coverage problem”,通过给源语言单词分配 “fertilities” 来限制每个单词可以接收的注意力,同时提出了一种新的稀疏的注意力变换方式 “sparsemax”,并在三种语言对上进行实证评估。