CrIBo：跨图像对象级自监督学习

Oct, 2023

CrIBo: Self-Supervised Learning via Cross-Image Object-Level Bootstrapping

Tim Lebailly, Thomas Stegmüller, Behzad Bozorgtabar, Jean-Philippe Thiran, Tinne Tuytelaars

TL;DR通过利用最近邻检索来进行自监督表示学习在以物体为中心的图像中已被证明具有益处。然而，当应用于以场景为中心的数据集时，这种方法面临限制，其中图像中的多个物体仅在全局表示中隐含捕获。这种全局引导可能导致对象表示的不可取缠结。此外，即使以物体为中心的数据集也可以受益于一种细粒度的引导方法。为了应对这些挑战，我们引入了一种新颖的针对增强密集视觉表示学习的跨图像对象级引导方法。通过在训练过程中采用对象级最近邻引导方式，CrIBo 成为一个显著强大且适当的候选算法，用于在上下文中学习，并在测试时利用最近邻检索。CrIBo 在后一任务上表现出了最新的性能，同时在更常见的下游分割任务中具有极高的竞争力。我们的代码和预训练模型将在接受后公开提供。

Abstract

Leveraging nearest neighbor retrieval for self-supervised representation learning has proven beneficial with object-centric images. However, this approach faces limitations when applied to scene-centric datasets,

self-supervised representation learning nearest neighbor retrieval scene-centric datasets object representations cross-image object-level bootstrapping

发现论文，激发创造

单正多标签识别语义对比自举

本研究提出了一种基于语义对比引导的递归语义掩蔽转换器和引导框架，用于解决多标签图像识别中单一正标签的困难问题，通过迭代优化网络参数和细化语义指导，显著提高了多标签图像识别的性能。

Jul, 2023

CYBORGS: 通过基于分割的文本信息对比性地增强物体表示

本研究提出了一种通过联合学习表示和分割来达到在特定场景（如 COCO）上预训练模型和在 Iconic 图片（如 ImageNet）上预训练模型之间的准确度缩小的框架，结果发现相对于之前的方法，在分类、检测和分割等下游任务中表现得更稳健。

Mar, 2022

CrOC: 跨视角在线聚类用于稠密视觉表征学习

该论文提出了一种基于交叉一致性目标和在线聚类机制的密集视觉表示学习方法，能够在不需要手工先验知识的情况下，自动发现和分割视觉场景数据中的语义信息，并在多个数据集上展示出优秀的线性和非监督分割转移能力，例如视频对象分割。

Mar, 2023

深度神经网络自学目标定位

介绍了一种新方法，利用深度卷积神经网络对整张图片进行训练，以在不额外进行人工监督的情况下定位图像中的物体，并将该思想嵌入凝聚聚类技术中，产生自学习定位假设。实验证明，使用我们的方法自动生成的注释可用于训练物体探测器，产生接近于手动注释的边界框的识别结果。

Sep, 2014

启动您自己的对应关系

该研究提出了一种名为 BYOC 的自我监督方法，该方法能够从 RGB-D 视频中学习到视觉和几何特征，而不依赖于真实姿态或对应关系，它将传统的点云配准思路与更近期的表征学习方法相结合，并取得了比传统和学习型描述符更好的性能。

Jun, 2021

RobustCLEVR：用于评估物体中心化学习的鲁棒性的基准和框架

通过研究对象为中心的表示学习方法，我们开展了具有专家知识根据因果依赖的图像生成过程产生各种图像破坏无法实现的鲁棒性评估，结果发现对象为中心的方法对图像破坏并不稳健，此工作在实现对复杂破坏过程下模型性能和退化更具体和有力的理解方面迈出了一步。

Aug, 2023

空间一致的表示学习

本论文提出了一种空间一致性表示学习算法 (SCRL)，通过几何翻转和缩放操作，采用新颖的自监督目标生成具有相关性的局部区域的一致空间表示，我们的方法比目前的监督预训练方法和最新的自监督学习方法在各种基准数据集上均表现出显著的性能改进。

Mar, 2021

LOCATE：基于流引导图割和自主引导自训练的自监督目标发现

利用动态信息和外观信息，我们提出了一种自我监督的目标发现方法，该方法能够生成高质量的目标分割遮罩，并在多个基准测试中取得与现有方法相媲美甚至超越的结果。

Aug, 2023

跨视角基于学习的关系对象匹配

本论文提出了一种基于 RGB 图像的目标检测匹配的学习方法，结合了局部关键点与新颖的物体级特征，通过关联图神经网络训练，在许多视图上具有较好的性能并优于现有的纯关键点匹配方法。

May, 2023

从朋友那儿获取帮助：最近邻对比学习视觉表示

NNCLR 是一种基于最近邻对比学习的自监督学习算法，将数据集中最近邻作为正样本而不是图像的不同视角，能够提供比预定义的变换更多的语义变化，达到了在 ImageNet 分类和迁移学习基准测试中超越现有先进方法的效果。此外，该方法的鲁棒性能更好，对于数据变换的依赖性更小。

Apr, 2021