Oct, 2023

SAMCLR:利用 SAM 进行视图采样的复杂场景对比式预训练

TL;DR在计算机视觉中,自监督对比学习通过使同一图像的不同视图具有类似的表示来实现。我们提出了 SAMCLR,它是 SimCLR 的一个附加部分,使用 SAM 将图像分割成语义区域,然后从同一区域采样两个视图。初步结果表明,在 Cityscapes 和 ADE20K 上进行预训练,然后在 CIFAR-10、STL10 和 ImageNette 上进行分类评估时,SAMCLR 不仅与 SimCLR、DINO 和 MoCo 相当,而且往往明显优于它们。