ECCVApr, 2022

重新审视高频组件,提高视觉 Transformer 的性能

TL;DR本研究通过频率分析发现 Vision Transformer 对高频图像部分不足,从而提出了基于对抗训练的高频数据增强方法 (HAT),可显著提升 Vision Transformer 模型的性能并适用于下游任务。