Jun, 2022

无标签图像分类的屏蔽无监督自训练

TL;DR本文提出了一种利用目标领域丰富的无标注数据改进已预训练的零样本分类器的无监督微调方法 Masked Unsupervised Self-Training(MUST)并在各种下游任务上证明了其有效性,包括在 ImageNet 上使用 ViT-B 的准确率高达 77.7%,比 CLIP 高 9.4%,比 16-shot CLIP 适应高 6.2%。