Mar, 2024

超越 MOT:语义多对象跟踪

TL;DR引入了 Semantic Multi-Object Tracking (SMOT) 的研究,旨在估计物体的轨迹并理解与轨迹相关的语义细节,包括实例描述、实例交互和整体视频描述,整合了 “where” 和 “what” 以进行跟踪。同时介绍了用于 SMOT 的一个大规模基准测试集 BenSMOT,提供了目标轨迹的注释以及自然语言的实例描述、实例交互和整体描述。此外还提出了专门为 SMOT 设计和端到端训练的新型跟踪器 SMOTer,并通过发布 BenSMOT 和 SMOTer 来推动跟踪领域朝着了解视频的新方向发展。