Aug, 2023

第 5 届 LSVOS 挑战赛冠军解决方案:视频实例分割

TL;DR视频实例分割方法 DVIS 在训练过程中引入了去噪策略以实现在复杂和长视频中更稳定准确的目标跟踪,并利用 DINO v2 预训练的冻结的 VIT-L 模型探索了视觉基础模型在视频实例分割中的作用,最终在第 5 届 LSVOS 挑战赛中获得了第一名,其在开发和测试阶段分别达到了 57.9 AP 和 56.0 AP。