ECCVMar, 2022

mc-BEiT:针对图像 BERT 预训练的多选项离散化

TL;DR本文提出了一种改进的 BERT-style 图像预训练方法,即 mc-BEiT,通过以多项选择形式指导被屏蔽的图像贴片生成监督信息,以及提高感知水平,以获取更好的视觉词汇标记。实验结果显示,相较于其他方法,预训练的 mc-BEiT 在图像分类,目标检测和语义分割任务中表现更为优异。