EMNLPNov, 2020

检测机器翻译中单词义消歧偏差的方法,以进行模型无关的对抗攻击

TL;DR本文针对神经机器翻译模型在词义消歧中由于过度依赖训练数据中的表浅词共现而产生的错误提出了一种基于统计数据特性的预测方法,并在多个领域和模型类型中验证了其有效性。同时,我们还开发了一种简单的对抗攻击策略,最小化地扰动句子以引发消歧错误,以进一步探索翻译模型的鲁棒性。我们的发现表明不同领域中的消歧鲁棒性差异很大,并且在相同数据上训练的不同模型容易遭受不同的攻击。