通过检测不正确位置嵌入进行表示学习

AAAIApr, 2022

通过检测不正确位置嵌入进行表示学习

Representation Learning by Detecting Incorrect Location Embeddings

Sepehr Sameni, Simon Jenni, Paolo Favaro

TL;DR本文提出了一种名为 DILEMMA 的方法，通过使用自监督学习来提高图像表征的性能。该方法使用图像令牌来代表物体的部分，并训练一个 ViT 模型来检测人为移位的图像令牌，从而提高鲁棒性和训练速度，并通过在 ImageNet-1K 上进行线性探测转移，在 MoCoV3、DINO 和 SimCLR 模型中分别实现 4.41％，3.97％和 0.5％的性能提高。

Abstract

In this paper, we introduce a novel self-supervised learning (SSL) loss for image representation learning. There is a growing belief that generalization in deep neural networks is linked to their ability to discriminate object shapes. Since →

self-supervised learning object shape image tokens vit dilemma

发现论文，激发创造

使用局部对比损失的自监督学习，用于检测和语义分割

提出了一种自监督学习方法，适用于对象检测和语义分割等半全局任务，通过在训练期间最小化像素级的本地对比损失（LC-loss），在自学习特征中强制实现对变换后的同一图像的相应图像位置之间的本地一致性，可将 LC-loss 添加到现有的自监督学习方法中，并在 COCO、PASCAL VOC 和 CityScapes 数据集上评估 SSL 方法，结果比现有的先进自监督学习方法在 COCO 对象检测、PASCAL VOC 检测和 CityScapes 分割等任务上分别提高了 1.9％，1.4％和 0.6％。

Jul, 2022

FLSL: 特征层面自监督学习

本文探究了使用 Transformer 进行联合嵌入和聚类的一种方法，即两级特征聚类自监督学习（FLSL），该方法在密集预测任务中取得了显著的改进，包括目标检测和实例分割，实验表明 FLSL 方法在各项测试中始终表现优异。

Jun, 2023

场景图像的多标签自监督学习

使用多标签自监督学习（MLS）方法，通过将场景 / 多标签图像的自监督学习简化为多标签分类问题，我们可以学习到高质量的图像表示，该方法在 MS-COCO 上获得了分类、检测和分割方面的最先进结果，并且比现有的方法简单易用，便于部署和进一步探索。

Aug, 2023

SegLoc”: 针对安全检查 X 射线图像的密集预测任务量身定制的新型视觉自监督学习方案的研究

使用自我监督学习方案对人工智能进行了重要进展，将对比学习整合到现有的自我监督学习模型中，在计算机视觉领域取得了显著的进展，通过提出的模型 Segmentation Localization 对密集预测的语义分割任务进行了评估，并通过实现每个类别一个队列的思想在 MoCo-v2 中避免了假阴性对。

Oct, 2023

物体发现和表示网络

Odin 是一种自我监督学习范式，通过耦合对象发现和表征网络来自主发现有意义的图像分割，而无需人工干预，可实现 COCO 目标检测、实例分割及 PASCAL、Cityscapes 的语义分割等领域的迁移学习效果，并在 DAVIS 视频分割方面超越监督预训练的方法。

Mar, 2022

虚拟嵌入和自一致性用于自监督学习

TriMix 是一种自我监督学习的新概念，通过数据线性插值生成虚拟嵌入，积极探索潜在的空间扩充，其提出的方法在自我监督学习和半监督学习任务中表现良好。

Jun, 2022

自我监督表示学习的视觉地理定位

利用自监督学习方法提升视觉地理定位技术性能和训练效率，通过统合 SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins 和 VICReg 等多种自监督学习方法，研究训练策略和参数设置对视觉地理定位任务的适应性

Jul, 2023

自监督学习的逆向工程

本文深入分析了自监督学习的机制以及其对表示学习的影响，揭示了自监督学习在样本聚类方面的潜在驱动作用，同时证实了该方法所训练的表示与语义类别之间存在着密切的对齐关系，并且这种对齐关系随着训练和网络深度的加深而不断增强，这对于提高自监督学习方法的性能和效果具有重要的理论和实际意义。

May, 2023

自监督学习在利用 Transformer 进行物体检测方面的实证研究

研究使用自监督学习中的图像重构、遮蔽图像建模和拼图等方法来训练物体检测转换器的编码器，以实现预训练和多任务学习，并在 iSAID 数据集上进行了初步实验。

May, 2022

自监督对比学习的几何理解

本文研究了自监督学习中编码器和映射器的关系，发现数据增强策略的增加会导致映射器变得更加不变，从而学习将数据投影到低维空间中，具有理论和实验结果的几何学解释。

May, 2022