ACLMay, 2020

神经机器翻译模型的不合理波动性

TL;DR研究了神经机器翻译模型的行为,发现模型在翻译极其相似的句子时具有不稳定的行为,并且在极端情况下可能导致误译,突出了当前 NMT 模型的泛化问题。发现 RNN 和变压器模型分别在 26%和 19%的句子变化中都表现出不稳定行为。