ICCVAug, 2023

MeViS:一个基于运动表达的大规模视频分割基准

TL;DR本研究旨在使用运动表达引导的视频分割,通过在描述对象运动的句子上对视频内容中的对象进行分割。我们提出了一个名为 MeViS 的大规模数据集,其中包含了大量的运动表达,用于指示复杂环境中的目标对象。通过对 MeViS 数据集进行 5 种现有的参考视频对象分割方法进行基准测试和全面比较,结果表明目前的方法不能有效地处理运动表达引导的视频分割。我们进一步分析了所面临的挑战,并在 MeViS 数据集上提出了一个基准方法。我们的目标是提供一个平台,以便开发对复杂视频场景中的对象分割利用运动表达作为主要线索的有效语言引导视频分割算法。MeViS 数据集已在此 URL 发布。