Mar, 2024

超越MOT:语义多对象跟踪

TL;DR引入了Semantic Multi-Object Tracking (SMOT)的研究,旨在估计物体的轨迹并理解与轨迹相关的语义细节,包括实例描述、实例交互和整体视频描述,整合了“where”和“what”以进行跟踪。同时介绍了用于SMOT的一个大规模基准测试集BenSMOT,提供了目标轨迹的注释以及自然语言的实例描述、实例交互和整体描述。此外还提出了专门为SMOT设计和端到端训练的新型跟踪器SMOTer,并通过发布BenSMOT和SMOTer来推动跟踪领域朝着了解视频的新方向发展。