Jun, 2024

2024 PVUW 工作坊 CVPR 赛道多目标视频分割冠军解决方案

TL;DR在视频目标分割领域,尤其是对象被遮挡和分割成部分的复杂场景中,追踪和分割多个对象一直是一项挑战。本研究提出了一种基于语义嵌入的视频目标分割模型,使用对象的显著特征作为查询表征,通过语义理解帮助模型识别对象的部分,并捕捉对象更具辨识性的特征。在大规模视频目标分割数据集上进行训练,我们的模型在 2024 年 PVUW Challenge 复杂视频目标分割赛道的测试集中取得第一名(84.45%)。