ICLRFeb, 2023

层次接枝预训练:将对比学习和遮蔽图像建模结合,实现低标签表示学习

TL;DR本文提出层级嫁接预训练 (Layer Grafted Pre-training) 方法,以笔者实验观察到的低层适合 MIM,高层适合 CL 为出发点,采用简单的 “顺序级联” 方式依次训练,旨在学习好的视觉表示。在 ImageNet-1k 数据集上,结合 ViT-B/16 能够取得 65.5% 的 1% few-shot 学习 Top-1 准确率,在无必要的改进的情况下提高了 MIM 和 CL 的基线水平 14.4% 和 2.1%。