May, 2022

适应形态:为可扩展视觉识别调整视觉变换器

TL;DR提出了一种叫做 “AdaptFormer” 的方法,可将预训练的视觉 Transformer 模型快速适应于多个图像和视频识别任务中,在不更新原预训练参数的情况下,只增加不到 2%的额外参数,就能显著提高模型的可迁移性和表现