WWWNov, 2020

使用并行数据投毒的有针对性黑盒神经机器翻译攻击

TL;DR本文介绍针对黑盒神经机器翻译系统的有针对性攻击方法,通过污染少量的平行训练数据来实现攻击,对包括大规模众包数据在内的最新系统的攻击成功率均超过 50%,并提出了针对此类攻击进行防御的可能性。