EMNLPSep, 2020

用 Softmax 温化技术训练神经机器翻译模型

TL;DR本研究探讨了采用 softmax tempering 技术来训练神经机器翻译模型,在亚洲语言 Treebank 数据集和 WMT 2019 英德翻译任务中实验证明该技术显著提高翻译质量,同时使贪心搜索与 Beam Search 解码同为一体,从而实现高速翻译。此外,我们还分析了 softmax entropy 和梯度对 NMT 模型内部行为的影响。