Oct, 2021

BadPre:面向预训练 NLP 基础模型的任务无关 后门攻击

TL;DR本研究提出了首个不依赖下游任务信息的 NLP 预训练模型后门攻击技术 Name,并设计了一种有效的绕过最新防御方案的策略,实验结果表明,该方法可以在有效和隐蔽的权衡下,攻击各种 NLP 任务。