ICCVAug, 2023

通过测试时频域提示来提高遮蔽自动编码器的对抗鲁棒性

TL;DR本文研究了配备 BERT 预训练(例如 BEiT 和 MAE)的视觉变换器的敌对鲁棒性。令人惊讶的是,MAE 的敌对鲁棒性明显较差。我们的实证分析揭示了 BERT 预训练的敌对鲁棒性与重构目标的高相关性,即对屏蔽图像补丁的原始像素进行预测会降低模型的敌对鲁棒性。根据我们的分析,我们提供了一种简单而有效的方法来增强 MAE 的敌对鲁棒性,即使用从数据集提取的领域知识占据图像的中高频部分,从而缩小敌对扰动的优化空间。该方法通过在测试期间基于原型进行提示选择,将这些特定于聚类的频域视觉提示与输入图像结合。广泛的评估结果表明,我们的方法显著提高了 MAE 的敌对鲁棒性,同时保持其在 ImageNet-1k 分类中的清晰性能。