Jun, 2024

复杂视频理解的 PVUW 2024 挑战:方法与结果

TL;DR复杂环境下像素级视频理解的挑战,提供了基于 MOSE 数据集的复杂视频对象分割以及基于 MeViS 数据集的运动表达引导的视频分割两个新的跟踪,并通过提供具有挑战性元素的额外视频和注释来促进像素级视频场景的综合和强大的理解。