动态与静态：面向自主训练的视频对象分割的混合视觉对应

Apr, 2024

动态与静态：面向自主训练的视频对象分割的混合视觉对应

Dynamic in Static: Hybrid Visual Correspondence for Self-Supervised Video Object Segmentation

Gensheng Pei, Yazhou Yao, Jianbo Jiao, Wenguan Wang, Liqiang Nie...

TL;DR本文介绍了一种名为 HVC 的混合静态动态视觉对应框架，用于自监督视频对象分割。HVC 从静态图像中提取伪动态信号，实现了高效且可扩展的 VOS 模型。该方法利用极简的全卷积架构在图像裁剪视图中捕捉静态动态视觉对应关系，并通过统一的自监督方法学习静态 - 动态特征相似性的视觉表示，从而实现联合静态和动态一致性表示的学习。HVC 仅需要一次训练会话使用静态图像数据，显著减少内存消耗（约 16GB）和训练时间（约 2 小时），并在多个自监督 VOS 基准和附加视频标签传播任务中实现了最新的性能。

Abstract

Conventional video object segmentation (VOS) methods usually necessitate a substantial volume of pixel-level annotated video data for fully supervised learning. In this paper, we present HVC, a \textbf{h}ybrid static-dynamic \textbf{v}isual \textbf{c}orrespondence framework for

video object segmentation self-supervised vos hybrid static-dynamic visual correspondence pseudo-dynamic signals visual representations

发现论文，激发创造

自监督视频表示学习的静态和动态概念

该研究提出了一种新的自监督视频表示学习方案，分别学习全局视觉概念和局部特征，使用交叉注意力机制聚合不同概念的详细本地特征来执行局部概念对比，并取得了 UCF-101、HMDB-51 和 Diving-48 的最新成果。

Jul, 2022

自监督视频分割的统一掩模嵌入和对应关系学习

通过开发一个统一的框架，其中同时建模跨帧密集对应以进行本地区分特征学习并嵌入对象级上下文进行目标掩码解码，从而使得能够直接从未标记的视频中学习执行基于掩码的连续分割，而不是依赖于基于像素的关联的廉价 “复制” 标签的非直接方法。

Mar, 2023

通过时空对应学习提升视频物体分割

本研究提出了一种基于对空间 - 时间对应匹配的显式监督学习的视频物体分割方法，该方法可以在不增加额外训练成本、没有速度延迟和不需要架构修改的情况下提高目前最先进的匹配式 VOS 方法的性能。

Apr, 2023

利用正则化流抑制静态视觉提示的自监督视频表示学习

提出了一种基于概率分析的新方法，通过对视频编码进行正态流处理和随机变量建模来抑制静态视觉提示，从而获得更可靠的视频表示，这可以被更好地推广到各种下游任务中。

Dec, 2021

视频伪装目标检测隐式运动处理

提出了一种新的视频伪装目标检测 (VCOD) 框架，可以利用短期动态和长期时间一致性来检测视频帧中的伪装目标，采用单一优化框架统一了运动估计和对象分割，并使用空间 - 时间变换器从而有效地处理视频的时间动态，提供了一个名为 MoCA-Mask 的大规模 VCOD 数据集，为该方向的研究建立了综合性的基准测试。

Mar, 2022

视频分割的密集无监督学习

本研究提出了一种新的无监督学习方法，其中使用密集特征表示直接进行卷积全制度的学习来进行视频对象分割。通过使用一个简单的规则化方案，该方法能够提高分割精度并达到快速的训练收敛。最终，该方法在标准的视频对象分割基准测试中取得了较高的精度。

Nov, 2021

用于语义视频分割的动态单元体结构搜索

本文旨在开发一种通用方法，以前沿的语义视频分割技术结构为基础，通过使用神经体系结构搜索解决方案，设计连接每帧网络输出的上下文块。利用通用的方法，该方法能在市区景观和 CamVid 数据集等常见基准测试中实现稳定和准确的结果，并且仅需要 2 GPU 天即可完成。

Apr, 2019

虚拟对应：以人类作为极端视角几何的线索

该研究提出了一种基于虚拟对应关系的方法，可在极限视角图像中恢复相机的空间布局和场景的几何形状，以及在场景重建和新视角合成等下游任务中发挥作用。

Jun, 2022

自监督学习的视频对应流

本文提出了一种适用于匹配视频中对应点的特征嵌入的自监督学习方法，其中使用自然的时空一致性训练指针模型，并通过引入信息瓶颈和循环模型等方式来解决跟踪器漂移等挑战，最终取得了在视频分割和关键点跟踪上的最佳效果。

May, 2019

DVOS: 自我监督的密集纹理视频目标分割

使用多任务学习的扩散方法，我们发展了一种半自监督时空方法，通过模拟真实视频的光流和运动来合成可用于训练 DVOS 模型的计算机注释视频；在小麦头部分割方面，我们提出的方法表现出较高的性能，当在无人机捕捉的外部测试集上进行测试时，Dice 分数达到了 0.82。

Jun, 2024