May, 2023

分割和追踪任何事物

TL;DR该报告介绍了一种名为 SAMTrack 的框架,它允许用户精确有效地分割和跟踪视频中的任何物体,同时使用多模态交互方法对选择的多个物体进行追踪,可以在无人机技术、自动驾驶、医学成像、增强现实和生物分析等领域中使用。SAM-Track 将交互式关键帧分割模型 SAM 与提出的具有 AOT 的跟踪模型(DeAOT)结合起来,以便在视频中追踪物体,并融合了 Grounding-DINO,使该框架支持基于文本的交互。我们在 DAVIS-2016 Val(92.0%),DAVIS-2017 Test(79.2%)中展示了 SAM-Track 的显着能力,并在实际应用中展现其实用性。