使用自监督 Transformer 进行多目标定位的目标发现

Apr, 2023

使用自监督 Transformer 进行多目标定位的目标发现

MOST: Multiple Object localization with Self-supervised Transformers for object discovery

Sai Saketh Rambhatla, Ishan Misra, Rama Chellappa, Abhinav Shrivastava

TL;DR本文提出了使用自监督学习训练的 Transformer 网络定位多个物体的方法 MOST，并通过分形分析检测出前景补丁上的代币，将代币聚类生成边界框，最终在 PASCAL-VOC 07、12 和 COCO20k 数据集上表现优于其他方法，同时表明 MOST 可以用于目标检测的自监督预训练，并在全、半监督目标检测和非监督区域提议生成方面获得一致的改进。

Abstract

We tackle the challenging task of unsupervised object localization in this work. Recently, transformers trained with self-supervised learning

unsupervised object localization self-supervised learning transformers multiple object localization bounding boxes

发现论文，激发创造

无监督 Transformer 定位物体

本文提出了一种不需要昂贵的注释活动的图像集合中的目标本地化的简单方法（称为 LOST），该方法利用了以自我监督方式预训练的视觉转换器的激活特征，同时在 PASCAL VOC 2012 上的实验表明，该方法优于最先进的目标发现方法最高可达 8 CorLoc 点。此外，我们还展示了在发现对象的基础上训练一个不具有类别属性的检测器可以再次提高 7 个点，此外，我们在无监督对象发现任务上也展示了有希望的结果。

Sep, 2021

多尺度视觉转换器在弱监督目标定位中的深度聚类引导精炼

该研究论文提出了一种利用弱监督目标定位来学习物体定位的方法，通过多尺度物体定位变换器（MOLT）和深度聚类引导精化方法提高了定位准确度，并在公开的 ILSVRC-2012 数据集上进行了实验证明了该方法的有效性。

Dec, 2023

使用归一化切割的自监督 Transformers 进行无监督目标发现

本文提出了一种基于自监督学习训练的 Transformer 模型特征的基于图的对象发现方法，在图中进行规范化的图割以分组具有相似性区域的前景物体。该方法可以显著提高无监督对象发现的性能，也可以扩展到无监督凸显性检测和弱监督对象检测领域。

Feb, 2022

MST：遮蔽式自监督变压器用于视觉表示

本文提出了 MST 方法，它可以显式捕捉图像的局部上下文并保留全局语义信息，在密集预测任务上有更好的性能，在多个数据集上得到验证，并优于同等时期的监督方法和其可比的变体 DINO。

Jun, 2021

深度神经网络自学目标定位

介绍了一种新方法，利用深度卷积神经网络对整张图片进行训练，以在不额外进行人工监督的情况下定位图像中的物体，并将该思想嵌入凝聚聚类技术中，产生自学习定位假设。实验证明，使用我们的方法自动生成的注释可用于训练物体探测器，产生接近于手动注释的边界框的识别结果。

Sep, 2014

多层多实例弱监督目标定位

本文介绍了一种采用多实例学习方法、利用二进制标签训练目标探测器并推断正样本中物体的位置的弱监督学习方法，旨在解决目标分类定位问题，同时提出了一种多因素多实例学习流程和窗口细化方法，将之应用于高维特征，例如 Fisher 向量和卷积神经网络特征，并在使用 PASCAL VOC 2007 测试集进行实验验证其有效性。

Mar, 2015

学习仅需最少监督的物体定位

本论文提出了一种新方法，通过图像级标签，结合判别子模块覆盖问题和平滑的潜在 SVM 公式，实现仅需很少的监督，即可学习定位对象。实验表明，该方法在 PASCAL VOC 2007 检测中，相对于现有技术有 50％的平均精确度提升。

Mar, 2014

基于注意力机制和软最大值的无监督多目标分割

利用平移等变性注意机制进行的无监督物体中心表示学习和多物体检测与分割架构，其中使用注意机制来预测场景中物体的坐标并为每个物体关联一个特征向量。

May, 2022

LISO：纯激光雷达无监督三维物体检测

自动驾驶堆栈中，3D 物体检测是最重要的组成部分之一，但当前最先进的激光雷达物体检测器需要昂贵而缓慢的人工注释才能取得良好性能。我们引入了一种自我监督方法来训练 SOTA 激光雷达物体检测网络，该方法仅基于未标记的激光点云序列工作，我们称之为轨迹规范化自我训练。我们演示了我们的方法对于多个 SOTA 物体检测网络在多个真实世界数据集上的有效性。

Mar, 2024

一种自监督微型一次性纹理分割 (MOSTS) 模型，用于实时机器人导航和嵌入式应用

本文研究利用自监督一次性纹理分割框架和 RGB-D 相机实现鲁棒的可行驶区域分割并在与现有一次性纹理分割模型和两种最先进的室内语义分割模型进行比较的基准研究中表现出极具竞争力的准确性和速度。

Jun, 2023