BriefGPT.xyz
Sep, 2021
黑盒环境下查询效率攻击的强基准
A Strong Baseline for Query Efficient Attacks in a Black Box Setting
HTML
PDF
Rishabh Maheshwary, Saket Maheshwary, Vikram Pudi
TL;DR
该研究提出了一种查询效率高的攻击策略来生成文本分类和蕴含任务中的可信对抗性样例,并通过使用注意力机制和局部敏感哈希来减少查询次数。对三个不同的搜索空间使用四种基线进行比较,平均来说我们在所有数据集和目标模型中将查询次数降低了75%。在受限查询设置中,与以前的攻击相比,我们的攻击成功率更高。
Abstract
Existing black box search methods have achieved high success rate in generating
adversarial attacks
against
nlp models
. However, such search methods are inefficient as they do not consider the amount of queries r
→