Apr, 2024

LVOS:大规模长期视频对象分割的基准

TL;DR视频对象分割(VOS)旨在在视频中区分和跟踪目标对象。我们提出了一个名为 LVOS 的新基准,比现有的数据集包含长 5 倍的视频,以更好地反映 VOS 模型在实际场景中的性能。在 LVOS 中,我们评估了 20 个现有的 VOS 模型,并发现这些模型在真实场景中遇到了较大的性能下降,突出了在实际世界场景中实现精确跟踪和分割的挑战。