视频目标实例遮挡分割:数据集与 ICCV 2021 挑战赛
我们收集了一个大规模的被遮挡的视频实例分割数据集,即检测,在遮挡场景中同时分割和跟踪实例,实验表明,现有的视频理解系统无法理解这些被遮挡的实例,我们还提出了一个简单的插件模块,用于补充遮挡引起的缺失对象线索,建立在 MaskTrack R-CNN 和 SipMask 上,在 OVIS 数据集上取得了显着的 AP 提升。
Feb, 2021
本研究提出和研究了一项新的计算机视觉任务,名为 OpenVIS,该任务旨在根据对应的文本描述同时分割,检测和跟踪视频中的任意对象。通过开放词汇的设计,OpenVIS 可以识别所需类别的对象,而不管这些类别是否包括在训练数据集中。为了实现这一目标,本文提出了一个由两个阶段组成的流程,首先利用基于查询的蒙版提议网络生成所有潜在对象的蒙版,并通过预先训练的 VLM 预测其对应的类别,其次通过提议后处理方法更好地适应预训练的 VLMs,以避免扭曲和不自然的提议输入。
May, 2023
本文提出了开放词汇视频实例分割这一新颖任务,在收集的大词汇量视频实例分割数据集上基于集成的 MindVLT 实现了该任务。实验结果表明,该方法能够有效地处理实际中从未见过的新类别,并且提供了数据集和代码以促进未来的研究。
Apr, 2023
2018 年的 DAVIS 挑战赛主要包括视频对象分割的任务,比赛使用 DAVIS 2017 数据集,增加了 100 个多对象序列视频,添加了交互式分割 Teaser 赛道。
Mar, 2018
UVIS 是一种无监督视频实例分割框架,利用 DINO 模型的密集形状先验和 CLIP 模型的开放识别能力,通过帧级伪标签生成、基于 Transformer 的 VIS 模型训练和基于查询的跟踪等三个关键步骤实现,通过采用双存储器设计,包括语义存储器和跟踪存储器,以提高无监督环境下 VIS 预测的质量,在 YoutubeVIS-2019 等相应基准上取得了 21.1 AP 的结果,展示了该无监督 VIS 框架的潜力。
Jun, 2024
本文介绍了 2017 年 DAVIS 视频物体分割挑战赛,该挑战赛是一个公共数据集,评测方法和比赛,它是为了特别针对视频物体分割任务而设计的,挑战赛遵循其他成功首创的做法,如 ILSVRC 和 PASCAL VOC,DAVIS 挑战赛包括数据集、评估方法和与 CVPR 2017 同地举办的独立工作坊,本文还描述了该基准测试的范围、数据集的主要特征、竞赛的评价指标,并对参赛者的结果进行了详细分析。
Apr, 2017
自主车辆需要准确理解其环境以安全导航。通过识别未知物体,特别是那些在训练过程中不存在的野生动物,以防止严重事故的发生非常重要。虽然语义分割方法在异常物体的识别方面取得了重大进展,但全面理解场景动态需要分割单个物体,因此实例分割至关重要。然而,由于缺乏专门的基准测试,这一领域的发展一直滞后。为了填补这一空白,我们将最常使用的异常分割基准测试扩展到实例分割任务。我们对异常实例分割方法的评估表明,这个挑战仍然是一个未解决的问题。可以在该网站和竞赛页面找到基准网址:[insert URL]。
Jun, 2024
近期的研究表明,针对具有挑战性和长视频序列而言,传统的离线方法不一定优于逐帧的在线处理。本研究提出了新的面向近在线视频实例分割(NOVIS)方法,并通过详细分析不同处理范式和新的端到端可训练模型,证明了该方法的优越性,并在 YouTube-VIS(2019/2021)和 OVIS 基准测试中取得了新的最先进的结果。
Aug, 2023