ICCVAug, 2021

通过对比掩模预测进行自监督视觉表示学习

TL;DR本文提出了一种基于掩模对比学习(CMP)的自监督视觉表示法,利用区域级特征对比而不是视角层级特征对比,以消除隐式的语义一致性假设并实现正样本的无假设定位。使用专门的掩模预测头解决了掩模和非掩模特征之间的域差异,实验结果表明该方法在自然数据集上获得了可比较的性能,并且在大量下游任务上比 MoCo V2 表现更强。