Mar, 2021
关于视觉Transformer的对抗鲁棒性
On the Adversarial Robustness of Visual Transformers
TL;DR本文对视觉Transformer(ViT)的抗干扰性进行了全面的研究,发现相比于MLP-Mixer和卷积神经网络(CNNs),ViTs拥有更好的对抗性鲁棒性。经过频率分析和特征可视化,发现ViTs所学习的特征中包含的高频模式较少,这有助于解释为什么ViTs对高频扰动较不敏感,并且现代CNN设计可以帮助填补ViTs和CNNs表现的差距。