ACLJun, 2023

关于通用对抗干扰的无数据对抗检测的有效性

TL;DR本论文提出了一种不需要原始训练数据即可计算 UAPs 的数据无关对抗性检测框架,并对各种文本分类任务进行了实验证明其具有竞争性的检测性能,且与正常推断相当。