YouTube-VOS: 一个大规模的视频目标分割基准测试
本文介绍了一个基于大规模数据集的序列 - 序列网络,能够充分利用视频的长期时空信息进行分割,在 YouTube-VOS 测试集上取得了最佳结果,在 DAVIS 2016 上与现有最先进方法相比也有可比性。
Sep, 2018
本文提出了一个简单而有效的解决方案,通过分析数据集分布、引入公共静态和视频分割数据集增补数据集,改进了三种不同特性的网络结构并训练多个网络去学习视频中物体的不同特性,通过简单的整合和精细的后处理确保精准的视频对象分割。在 Youtube-VOS 数据集上的广泛实验表明,该解决方案达到了 86.1% 的整体分数,是 Youtube-VOS Challenge 2022 中视频对象分割轨迹第五名的最新技术水平。
Jun, 2022
视频对象分割(VOS)旨在在视频中区分和跟踪目标对象。我们提出了一个名为 LVOS 的新基准,比现有的数据集包含长 5 倍的视频,以更好地反映 VOS 模型在实际场景中的性能。在 LVOS 中,我们评估了 20 个现有的 VOS 模型,并发现这些模型在真实场景中遇到了较大的性能下降,突出了在实际世界场景中实现精确跟踪和分割的挑战。
Apr, 2024
该研究提出了一种新的、自动化的视频物体分割方法,通过集成一种可区分的少量样本学习模块,提高了分割精度,实现了当前 YouTube-VOS 2018 数据集的最新最佳分数,并使相对改进率达到了 2.6%以上。
Mar, 2020
该研究提出了一种新的视频对象分割方式,它由轻量级模块和分割模型两部分组成。在推理阶段使用快速优化技术学习目标外观模型,以预测出粗略但鲁棒的目标分割,然后将粗略的分数转化成高质量的分割掩模,该模式具有快速、易于训练、在有限的训练数据情况下仍然高效等优点。在挑战性的 YouTube-VOS 和 DAVIS 数据集上进行了广泛实验,其结果与现有技术相比具有更高的帧率和优异的性能。
Feb, 2020
本文提出了一个基于正则化的持续学习方法用于解决在线视频对象分割问题(VOS),取得了很好的效果,同时建立了一个基准公共数据集 CLVOS23。这是首次将 VOS 作为一个持续学习问题来定义和解决。
Apr, 2023
本文介绍了一种将 “tracking-by-detection” 引入视频对象分割的方法,通过提出一种新的时间聚合网络和新的动态时间演进模板匹配机制,成功将分割与跟踪相一致,并在 DAVIS 基准测试中取得了新的最优表现。
Jul, 2020
视频目标分割是计算机视觉中的重要任务,研究了切割模型的灵感、对象记忆、内存帧总数和输入分辨率对分割性能的影响,并在复杂视频目标分割(MOSE)数据集上验证了我们方法的有效性,实验结果表明在测试集上达到了 0.8139 的 J&F 得分,在处理具有挑战性的 VOS 场景中具有强大的鲁棒性和准确性。
Jun, 2024
本文提出了 UVO(未识别视频对象),这是一个用于视频中开放世界类无关对象分割的新基准,由于其更大,更具挑战性且可以用于目标跟踪和超像素分割等其他应用,因此可用于研究人员开发新的方法。
Apr, 2021
提出了一种基于稀疏点注释方案的新型 Point-VOS 任务和标注机制,通过基于伪掩码的训练可以使现有的 VOS 方法在性能上接近全监督的表现,并且该数据可用于改进视觉和语言相关的模型。
Feb, 2024