Mar, 2024

GenView: 使用预训练生成模型提升自监督学习的视图质量

TL;DR自监督学习通过从无标签数据中获取高质量的表示已经取得了显著的成功。GenView 是一个可控的框架,通过增加积极视角的多样性利用预训练生成模型的能力,同时保留语义。研究中引入了自适应视角生成方法来调整采样噪声水平,以确保保留基本语义意义并引入变异性。此外,引入了质量驱动的对比损失,通过考虑前景相似性和背景多样性评估正样本对的质量。GenView 明显改善了各种任务中的自监督学习性能,例如,在 ImageNet 线性 / 半监督分类上,GenView 将 MoCov2 的性能提高了 2.5%/2.2%。此外,与简单地使用 Laion400M 或 ImageNet21K 扩充 ImageNet 数据集相比,GenView 的性能更好。