BriefGPT.xyz
May, 2022
揭示面具图像建模的黑暗秘密
Revealing the Dark Secrets of Masked Image Modeling
HTML
PDF
Zhenda Xie, Zigang Geng, Jingcheng Hu, Zheng Zhang, Han Hu...
TL;DR
本研究通过可视化和实验的角度比较了遮蔽图像模型(MIM)和长期优势的监督式预训练模型的关键表现差异,发现MIM可以在所有训练模型的层上引入位置归纳偏差并保持所有层的多样性,从而在较弱语义或细粒度分类任务中表现出色。
Abstract
masked image modeling
(MIM) as
pre-training
is shown to be effective for numerous
vision downstream tasks
, but how and where MIM works rem
→