NIPSJul, 2018

潜在对齐与变分注意力

TL;DR本文通过提出基于平均化变分推断损失函数的变分注意力网络方法,可以更有效地学习到潜变量对齐模型,取得了与硬注意力等传统方法相当和甚至更好的性能,在机器翻译和视觉问答任务上表现优异。