May, 2022
适应形态:为可扩展视觉识别调整视觉变换器
AdaptFormer: Adapting Vision Transformers for Scalable Visual Recognition
Shoufa Chen, Chongjian Ge, Zhan Tong, Jiangliu Wang, Yibing Song...
TL;DR提出了一种叫做 “AdaptFormer” 的方法,可将预训练的视觉 Transformer 模型快速适应于多个图像和视频识别任务中,在不更新原预训练参数的情况下,只增加不到 2%的额外参数,就能显著提高模型的可迁移性和表现