Jun, 2024

基于转换的对抗攻击

TL;DR我们引入了转换依赖型对抗攻击,一种新的威胁类型,其中一个单一的加性扰动可以通过系统地转换输入(例如缩放、模糊、压缩)触发多样化、可控的错误预测。与具有静态影响的传统攻击不同,我们的扰动嵌入了变态学特性,可以根据转换参数的函数实现不同的对抗攻击。我们展示了在模型(例如卷积网络和视觉变压器)和视觉任务(例如图像分类和目标检测)上的转换依赖性漏洞。我们提出的几何和光度转换使得从一个精心制作的输入中能够产生一系列有针对性的错误(例如对于分类器的超过 90% 的攻击成功率)。我们分析了模型结构、变换类型 / 多样性对攻击效果的影响。这项工作通过重新定义对抗输入为动态的、可控的威胁,强制进行范式转变。我们强调了对抗这种多方面、变色龙般的扰动的强大防御措施的需求,而当前的技术则显得力不从心。