Sep, 2021

黑盒环境下查询效率攻击的强基准

TL;DR该研究提出了一种查询效率高的攻击策略来生成文本分类和蕴含任务中的可信对抗性样例,并通过使用注意力机制和局部敏感哈希来减少查询次数。对三个不同的搜索空间使用四种基线进行比较,平均来说我们在所有数据集和目标模型中将查询次数降低了75%。在受限查询设置中,与以前的攻击相比,我们的攻击成功率更高。