Jun, 2024

引导式多目标跟踪

TL;DR通过引入具有鉴别力的语言词汇,我们首先将 Refer-KITTI 转化为大规模数据集 Refer-KITTI-V2,解决了类别不平衡问题,并通过大型语言模型推进策略扩展了数据集,包含了 617 个不同的关键词,超过了之前 RMOT 基准。此外,RMOT 的端到端框架还通过简单而优雅的时间推进策略进行了优化,表现优于之前的方法。