FLSL: 特征层面自监督学习

Jun, 2023

FLSL: Feature-level Self-supervised Learning

Qing Su, Anton Netchaev, Hai Li, Shihao Ji

TL;DR本文探究了使用 Transformer 进行联合嵌入和聚类的一种方法，即两级特征聚类自监督学习（FLSL），该方法在密集预测任务中取得了显著的改进，包括目标检测和实例分割，实验表明 FLSL 方法在各项测试中始终表现优异。

Abstract

Current self-supervised learning (SSL) methods (e.g., SimCLR, DINO, VICReg, MOCOv3) target primarily on representations at instance level and do not generalize well to dense prediction tasks, such as object detec

self-supervised learning dense prediction tasks transformer clustering dense prediction improvements

发现论文，激发创造

场景图像的多标签自监督学习

使用多标签自监督学习（MLS）方法，通过将场景 / 多标签图像的自监督学习简化为多标签分类问题，我们可以学习到高质量的图像表示，该方法在 MS-COCO 上获得了分类、检测和分割方面的最先进结果，并且比现有的方法简单易用，便于部署和进一步探索。

Aug, 2023

使用局部对比损失的自监督学习，用于检测和语义分割

提出了一种自监督学习方法，适用于对象检测和语义分割等半全局任务，通过在训练期间最小化像素级的本地对比损失（LC-loss），在自学习特征中强制实现对变换后的同一图像的相应图像位置之间的本地一致性，可将 LC-loss 添加到现有的自监督学习方法中，并在 COCO、PASCAL VOC 和 CityScapes 数据集上评估 SSL 方法，结果比现有的先进自监督学习方法在 COCO 对象检测、PASCAL VOC 检测和 CityScapes 分割等任务上分别提高了 1.9％，1.4％和 0.6％。

Jul, 2022

SegLoc”: 针对安全检查 X 射线图像的密集预测任务量身定制的新型视觉自监督学习方案的研究

使用自我监督学习方案对人工智能进行了重要进展，将对比学习整合到现有的自我监督学习模型中，在计算机视觉领域取得了显著的进展，通过提出的模型 Segmentation Localization 对密集预测的语义分割任务进行了评估，并通过实现每个类别一个队列的思想在 MoCo-v2 中避免了假阴性对。

Oct, 2023

自监督学习的逆向工程

本文深入分析了自监督学习的机制以及其对表示学习的影响，揭示了自监督学习在样本聚类方面的潜在驱动作用，同时证实了该方法所训练的表示与语义类别之间存在着密切的对齐关系，并且这种对齐关系随着训练和网络深度的加深而不断增强，这对于提高自监督学习方法的性能和效果具有重要的理论和实际意义。

May, 2023

一个概率模型解释自监督表示学习

自监督学习在生成的潜在变量模型和对比方法的框架下，提出了一种能够改善性能、实现任务无关性表示的方法。

Feb, 2024

针对自监督视觉变换器的补丁级别表示学习

本文设计了一种称为 SelfPatch 的简单而有效的视觉预训练任务，利用 ViT 的特性，在无需人工注释的情况下提高不同类型视觉任务的性能，通过训练神经网络对各种图像的无监督学习来实现。

Jun, 2022

MLSL: 多层次自监督学习，带有空间独立和语义一致标记的领域自适应

本文提出了一种基于多级自监督学习模型的语义分割域自适应方法，通过分割多个子图像来生成空间独立且语义一致的伪标签，并计算图像级伪弱标签来捕捉源域和目标域中的全局上下文相似性，从而在像素数很少（例如小物体）的情况下帮助潜在空间学习表示。该方法在 GTA-V 到 Cityscapes 和 SYNTHIA 到 Cityscapes 的适应中均取得了优于现有方法的性能表现。

Sep, 2019

理解自监督特征用于学习无监督实例分割

自我监督学习（SSL）可以用于解决复杂的视觉任务，该论文研究了实例分割的自我监督表示，发现不同 SSL 方法的特征在实例感知水平上存在差异。

Nov, 2023

物体发现和表示网络

Odin 是一种自我监督学习范式，通过耦合对象发现和表征网络来自主发现有意义的图像分割，而无需人工干预，可实现 COCO 目标检测、实例分割及 PASCAL、Cityscapes 的语义分割等领域的迁移学习效果，并在 DAVIS 视频分割方面超越监督预训练的方法。

Mar, 2022

自我监督表示学习的视觉地理定位

利用自监督学习方法提升视觉地理定位技术性能和训练效率，通过统合 SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins 和 VICReg 等多种自监督学习方法，研究训练策略和参数设置对视觉地理定位任务的适应性

Jul, 2023