CVPRApr, 2023

掩膜图像建模的硬贴片挖掘

TL;DR本文提出了一个基于 Hard Patches Mining (HPM) 的框架,用于 Masked Image Modeling (MIM) 的预训练,采用相对关系学习策略,通过预测损失值来决定下一步的掩码。实验证明仅引入损失预测目标就能产生有效的表征,HMP 有效地构建了掩码图像,能够自我产生更具挑战性的问题。