Nov, 2022

注视所见:不需重建的遮蔽图像建模

TL;DR本文提出了一种名为MaskAlign的高效MIM范例,将可视化小片段功能与老师模型提取的整体图像特征相一致,证明即使在掩蔽区域没有重建的情况下,蒙面建模也不会失去效率。与Dynamic Alignment相结合,MaskAlign能够实现高效的最新性能。