ACLAug, 2019

正则化上下文门控制在 Transformer 机器翻译中的应用

TL;DR本文提出了一种在 Transformer 架构中引入 context gates 的方法,以控制源和目标的贡献。此外,还提出了一种规范化方法,以自动产生的点间互信息来指导门控的学习。在 4 个翻译数据集上的实验证明,该模型相对于强基线模型提高 1.0 的 BLEU 分数。