COLINGMay, 2022

Learn2Weight: 相似领域对抗攻击下的参数调适

TL;DR提出一种新的黑盒 NLP 对抗攻击,攻击者可以选择类似的领域并将对抗性样本转移到目标领域,本文提出学习调整目标模型权重的防御策略 ——Learn2Weight,证明其对 Amazon 多领域情感分类数据集等攻击效果优于传统防御方法。