语义引导的视频对象分割

Apr, 2017

Semantically-Guided Video Object Segmentation

Sergi Caelles, Yuhua Chen, Jordi Pont-Tuset, Luc Van Gool

TL;DR本研究探讨了如何通过引入语义先验来指导外观模型，从而解决半监督视频对象分割的问题，并提出了半监督视频对象分割（SGV）方法，该方法能够在每帧半秒钟的时间内，在两个不同的数据集上使用各种评估指标，比以前的最新技术取得更好的结果。

Abstract

This paper tackles the problem of semi-supervised video object segmentation, that is, segmenting an object in a sequence given its mask in the first frame. One of the main challenges in this scenario is the chang

semi-supervised video object segmentation semantic prior appearance model sgv

发现论文，激发创造

单次视频目标分割

本文提出一种基于神经网络的半监督视频目标分割技术，能够在保证处理速度的前提下提升目标分割的效果。

Nov, 2016

无时序信息的视频目标分割

该论文利用全卷积神经网络架构，基于 ImageNet 上学习的通用语义信息，结合单个对象的外观学习，实现了半监督的视频对象分割，提高了结果的精度和效率。

Sep, 2017

视频的自监督目标中心学习

本文提出了第一个完全无监督的方法，用于在真实场景的序列中分割多个对象，通过空间绑定对象并将这些槽联系起来，在高级语义特征空间中重建中间帧，解决了效率和规范化问题，成功地在 YouTube 视频中分割了复杂且多变的类别的多个实例。

Oct, 2023

使用跟踪对象提案进行视频对象分割

通过结合基于类别的目标检测、类别独立的目标外观分割和时间上的目标追踪等方法，通过训练全卷积网络对视频中的特定对象外观进行独立的分割，再引入对检测框时间上的连续性约束，从而实现半监督视频目标分割。

Jul, 2017

自监督视频分割的统一掩模嵌入和对应关系学习

通过开发一个统一的框架，其中同时建模跨帧密集对应以进行本地区分特征学习并嵌入对象级上下文进行目标掩码解码，从而使得能够直接从未标记的视频中学习执行基于掩码的连续分割，而不是依赖于基于像素的关联的廉价 “复制” 标签的非直接方法。

Mar, 2023

利用时空记忆网络进行视频对象分割

提出了一种用于半监督视频对象分割的新型解决方案，通过利用内存网络中的可用线索和遍历所有可用源中的相关信息来实现更好的处理外观变化和遮挡等挑战，从而实现了最先进的性能。

Apr, 2019

从静态图像学习视频对象分割

本文介绍了一种基于深度学习的视频对象分割方法，将其作为引导实例分割的概念，通过离线和在线学习策略，使卷积神经网络能够处理多种输入注释并在多个数据集上获得具有竞争力的结果。

Dec, 2016

有效选择高概率正特征实现视频中的无监督物体分割

本文提出了一种有效的无监督方法，基于高可能的正面特征的自动选择和学习，生成前景对象软分割遮罩

Apr, 2017

在视频数据中传播语义标签

通过结合基于 SfM 的 SAM 模型将视频中的目标进行分割和跟踪的方法，提出一种减少手动注释工作量的视频对象跟踪系统。系统性能经过计算时间、与手动标签的掩码 IOU 和跟踪损失数量等三个指标的评估，结果表明该系统在跟踪视频帧中的物体方面较人工表现有显著计算时间改善，但在性能上存在一定程度的退化。

Oct, 2023

视频语义分割的时序感知分层掩码分类

我们提出了一个用于视频语义分割（VSS）的新解决方案 THE-Mask，首次引入了时态感知的分层物体查询，并利用简单的两轮匹配机制，在训练过程中以最小代价匹配更多的查询对象，同时在推理过程中无需任何额外代价。为了支持多对一的分配，我们设计了一种分层损失来训练带有相应主次层级关系的查询。此外，为了有效捕捉帧间的时态信息，我们提出了一个时态聚合解码器，以无缝融入 VSS 的掩码分类模型，利用时态敏感的多级查询方法，在最新的具有挑战性的 VSS 基准 VSPW 上取得了最先进的性能。

Sep, 2023