ACLNov, 2020

SHIELD: 用随机多专家修补程序防御文本神经网络遭受多种黑盒对抗攻击

TL;DR提出一种名为 SHIELD 的算法,将文本神经网络的最后一层进行修改和重新训练,形成一种加权多专家预测头的随机加权集合,从而混淆攻击者并进一步提高模型准确率。