VideoCutLER：惊人简单的无监督视频实例分割

Aug, 2023

VideoCutLER：惊人简单的无监督视频实例分割

VideoCutLER: Surprisingly Simple Unsupervised Video Instance Segmentation

Xudong Wang, Ishan Misra, Ziyun Zeng, Rohit Girdhar, Trevor Darrell

TL;DR使用高质量伪蒙版和简单的视频合成方法进行模型训练，能够在视频中有效地分割和追踪多个实例，实现了具有竞争力的无监督学习结果。

Abstract

Existing approaches to unsupervised video instance segmentation typically rely on motion estimates and experience difficulties tracking small or divergent motions. We present VideoCutLER, a simple method for unsu

unsupervised video instance segmentation motion estimates pseudo masks video synthesis method competitive unsupervised learning

发现论文，激发创造

无监督物体检测和实例分割的切割学习

提出了一种名为 Cut-and-LEaRn（CutLER）的简单方法，以训练无监督的物体检测和分割模型，它首先使用所提出的 MaskCut 方法生成图像中多个对象的粗略蒙版，然后在这些蒙版上学习检测器，最后通过对模型的预测进行自我训练实现零样本无监督检测，大幅提升检测性能。

Jan, 2023

无需视频注释学习实例跟踪

本文介绍了一种利用标记图像数据和未标记视频序列学习实例跟踪网络的半监督框架，采用实例对比目标，利用学习的嵌入区分每个实例并在不同帧之间稳定地跟踪对象，并且将此模块集成到单阶段实例分割和姿态估计框架中，较之两阶段网络显著降低了跟踪的计算复杂度。无需任何视频标注努力，我们的方法可达到与大多数完全监督方法相当甚至更好的性能。

Apr, 2021

视频实例分割

本论文提出了一个新的计算机视觉任务，名为视频实例分割，目标是同时检测、分割和跟踪视频帧中的实例。为了便于研究，提出了一个大规模基准数据集 YouTube-VIS 和一个新算法 MaskTrack R-CNN。实验表明，这个算法优于强基线，并为未来研究提供了启示。

May, 2019

无监督通用图像分割

我们提出了一种名为 U2Seg 的无监督通用分割模型，能够使用统一框架执行多种图像分割任务：实例分割、语义分割和全景分割。该方法通过利用自监督模型生成伪语义标签，并在此基础上进行自我训练，达到了与专门设计的方法相比显著的性能提升，同时也为无监督全景分割建立了一个新的基准。此外，在少样本情况下，即只有 1% 的 COCO 标签时，U2Seg 也是强大的预训练模型，比 CutLER 在 APmask 上提升了 5.0 个点。我们希望我们简单而有效的方法能够激发更多关于无监督通用图像分割的研究。

Dec, 2023

UVIS: 无监督视频实例分割

UVIS 是一种无监督视频实例分割框架，利用 DINO 模型的密集形状先验和 CLIP 模型的开放识别能力，通过帧级伪标签生成、基于 Transformer 的 VIS 模型训练和基于查询的跟踪等三个关键步骤实现，通过采用双存储器设计，包括语义存储器和跟踪存储器，以提高无监督环境下 VIS 预测的质量，在 YoutubeVIS-2019 等相应基准上取得了 21.1 AP 的结果，展示了该无监督 VIS 框架的潜力。

Jun, 2024

Mask2Former 用于视频实例分割

通过直接预测 3D 分割体积，我们展示了通用的图像分割架构轻松推广到视频分割领域，Mask2Former 在视频实例分割方面也取得了最先进的性能，同时在 YouTubeVIS-2019 和 YouTubeVIS-2021 上分别达到了 60.4 AP 和 52.6 AP。由于在图像分割方面的多才多艺，我们相信 Mask2Former 也能处理视频语义和全景分割，我们希望这将使最新的视频分割研究更易于使用并引起更多人对通用图像和视频分割架构的关注。

Dec, 2021

具有时间掩码一致性的视频弱监督实例分割

本研究展示了弱监督视频实例分割可以通过训练应用在视频层面上的算法来解决由于目标物体缺失而引起的问题，提出了两种方法用于处理这一问题。

Mar, 2021

从视频中无监督学习和分割复杂活动

本文介绍了一种新的无监督视频分割方法，采用迭代鉴别生成方法，通过学习视频视觉特征并建模时序结构，将复杂活动划分为多个子活动，并引入背景模型，验证结果优于现有无监督及弱监督方法。

Mar, 2018

视频实例分割的深度学习技术综述

视频实例分割是一项新兴的计算机视觉研究领域，该论文调查了基于深度学习的视频实例分割方案，包括架构设计、性能比较、模型复杂度和计算开销，以及改进性能和未来研究方向等方面的信息。

Oct, 2023

预测运动的非监督视频和图像分割

本文提出一种融合基于运动和外观的分割方法，利用预测简单运动模式区域对图像分割网络进行监督，使其具备检测和学习静止物体的能力。通过实验发现该方法不仅在无监督视频分割领域表现出色，而且能够适用于包含新颖物体的静态图像分割领域，同时还能够处理多种运动模型和光流基准的影响。

May, 2022