Mar, 2024

使用特征多样性对抗攻击变形器

TL;DR提出了一种用于 Vision Transformer 模型的无标签白盒攻击方法,该方法在各种黑盒模型之间表现出较强的迁移性,包括大多数 Vision Transformer 变体、CNN 和 MLP,甚至是针对其他模态开发的模型。攻击的灵感来自于 Vision Transformer 中的特征重叠现象,其中关键的注意力机制过度依赖于特征的低频成分,导致中 - 末层的特征趋向相似并最终崩塌。提出的特征多样性攻击者可以自然加速这一过程,达到卓越的性能和可转移性。