Aug, 2023

掩蔽动量对比学习用于零样本语义理解

TL;DR通过自监督预训练技术(SSP),本研究旨在评估彻底自监督学习技术在计算机视觉任务中的有效性,无需微调,旨在模仿人类的泛化和识别未见目标的能力,并提出了一种基于标注块的零样本分割评估协议,以及评估 SSP ViTs 的内部和外部物体相似性来衡量其歧视能力,并设计了一种名为 MMC 的简单 SSP 方法,该方法通过对局部特征的相似性进行蒙版图像建模、基于动量的自蒸馏将全局语义转移到局部特征以及全局对比度来提升 SSP ViTs 的区分能力,有效地在图像中进行物体分割,实验结果显示 MMC 在各种数据集上实现了零样本语义分割的顶级效果。