视频对象分割的一次性训练
本文提出了一种新的视频对象分割训练范式 - 两张标记帧的视频对象分割,通过在训练期间生成伪标签并将其与已标记数据结合优化模型,我们仅需要稀疏注释就可以训练出令人满意的模型。通过使用 YouTube-VOS 和 DAVIS 基准测试的仅仅 7.3%和 2.9%标记数据,我们的方法取得了与全标记集训练的同行相当的结果。
Mar, 2023
该研究提出了一种新的、自动化的视频物体分割方法,通过集成一种可区分的少量样本学习模块,提高了分割精度,实现了当前 YouTube-VOS 2018 数据集的最新最佳分数,并使相对改进率达到了 2.6%以上。
Mar, 2020
该研究提出了一种新的视频对象分割方式,它由轻量级模块和分割模型两部分组成。在推理阶段使用快速优化技术学习目标外观模型,以预测出粗略但鲁棒的目标分割,然后将粗略的分数转化成高质量的分割掩模,该模式具有快速、易于训练、在有限的训练数据情况下仍然高效等优点。在挑战性的 YouTube-VOS 和 DAVIS 数据集上进行了广泛实验,其结果与现有技术相比具有更高的帧率和优异的性能。
Feb, 2020
EVA-VOS 是一种视频目标分割的人机协作注释框架,通过引入代理模型进行逐帧帧选择和注释类型预测,可以实现高准确度且比传统视频注释方法快 3.5 倍的对象掩模生成与注释时间降低。
Nov, 2023
本文介绍了一种将 “tracking-by-detection” 引入视频对象分割的方法,通过提出一种新的时间聚合网络和新的动态时间演进模板匹配机制,成功将分割与跟踪相一致,并在 DAVIS 基准测试中取得了新的最优表现。
Jul, 2020
该研究提出了一种基于循环神经网络的视频多目标分割模型,实现了零样本学习和时间上的目标连贯性,此模型在 DAVIS-2017 和 YouTube-VOS 基准测试上取得了优异的表现,并且其推理时间比现有方法更快。
Mar, 2019
本研究提出了一种基于对空间 - 时间对应匹配的显式监督学习的视频物体分割方法,该方法可以在不增加额外训练成本、没有速度延迟和不需要架构修改的情况下提高目前最先进的匹配式 VOS 方法的性能。
Apr, 2023
本研究提出了一种端到端的深度神经网络,结合了 Mask-RCNN 实例分割网络和 Conv-GRU 视觉记忆模块,用于解决半监督视频对象分割任务,实验结果表明该方法在 DAVIS 数据集上取得了令人满意的结果。
Sep, 2019