CSS-Segment:LSVOS挑战VOS轨道的第二名报告
本文提出了一个简单而有效的解决方案,通过分析数据集分布、引入公共静态和视频分割数据集增补数据集,改进了三种不同特性的网络结构并训练多个网络去学习视频中物体的不同特性,通过简单的整合和精细的后处理确保精准的视频对象分割。在Youtube-VOS数据集上的广泛实验表明,该解决方案达到了86.1%的整体分数,是Youtube-VOS Challenge 2022中视频对象分割轨迹第五名的最新技术水平。
Jun, 2022
视频实例分割方法DVIS在训练过程中引入了去噪策略以实现在复杂和长视频中更稳定准确的目标跟踪,并利用DINO v2预训练的冻结的VIT-L模型探索了视觉基础模型在视频实例分割中的作用,最终在第5届LSVOS挑战赛中获得了第一名,其在开发和测试阶段分别达到了57.9 AP和56.0 AP。
Aug, 2023
Video Object Segmentation task is addressed by proposing Click Video Object Segmentation (ClickVOS), an end-to-end baseline approach called Attention Before Segmentation (ABS), which utilizes the given point in the first frame to perceive the target object through a concise yet effective segmentation attention, leading to improved object mask accuracy.
Mar, 2024
视频对象分割(VOS)旨在在视频中区分和跟踪目标对象。我们提出了一个名为LVOS的新基准,比现有的数据集包含长5倍的视频,以更好地反映VOS模型在实际场景中的性能。在LVOS中,我们评估了20个现有的VOS模型,并发现这些模型在真实场景中遇到了较大的性能下降,突出了在实际世界场景中实现精确跟踪和分割的挑战。
Apr, 2024
视频目标分割是计算机视觉中的重要任务,研究了切割模型的灵感、对象记忆、内存帧总数和输入分辨率对分割性能的影响,并在复杂视频目标分割(MOSE)数据集上验证了我们方法的有效性,实验结果表明在测试集上达到了0.8139的J&F得分,在处理具有挑战性的VOS场景中具有强大的鲁棒性和准确性。
Jun, 2024
本研究针对视频物体分割(VOS)任务中存在的挑战,提出了Segment Anything Model 2(SAM 2),该模型通过用户交互构建数据引擎,从而收集了迄今为止最大的分割数据集。研究结果表明,SAM 2在无需微调的情况下,在更具挑战性的VOS数据集MOSE和LVOS上表现出色,取得了75.79的J
Aug, 2024
本研究针对视频目标分割(VOS)中的对象遮挡、分裂及物体在拥挤场景中的追踪等挑战,提出了一种结合SAM2和Cutie模型的新方法。通过调试超参数,我们的方案在LSVOS挑战VOS赛道的测试阶段取得0.7952的J
Aug, 2024
本研究解决了视频物体分割(VOS)中的多个挑战,如物体遮挡、碎片化以及在拥挤场景中跟踪特定物体等问题。我们结合了最先进的SAM2和Cutie模型,探索了多种超参数对视频实例分割性能的影响,最终在LSVOS挑战VOS track的测试阶段获得0.7952的J
Aug, 2024
本研究针对当前视频目标分割方法在复杂场景和长时间物体运动中的不足,提出了一种区分性空间时序视频目标分割模型。该模型通过利用区分性物体特征作为查询表示,结合空间语义模块的理解,取得了第六届LSVOS挑战赛的第一名(80.90% $\mathcal{J \ F}$),展示了其在复杂环境下的有效性和精确度。
Aug, 2024
本研究解决了现有视频分割模型在复杂场景中表现不足的问题。我们引入了第六届大规模视频目标分割挑战,采用更具挑战性的MOSE、LVOS和MeViS数据集,评估视频对象分割(VOS)和指称视频对象分割(RVOS)。本次挑战吸引了来自20多个机构的129个团队参与,推动了视频目标分割技术的发展。
Sep, 2024