Nov, 2021

SimMIM: 简易掩模图像建模框架

TL;DR本文提出了 SimMIM 框架,通过探究每一个组件的简单设计方案,发现简单设计方案表现强劲,并在 ImageNet-1K 数据集上,使用 ViT-B 预训练和微调达到了 83.8%的 top-1 精度,并使用此方法促进 3B 模型(SwinV2-G)的训练,在四个代表性的视觉基准数据集中实现了最新的技术成果。