Jul, 2024

循环就业者:面向多视角3D检测和跟踪的对象感知时序表示学习

TL;DR我们提出了一个统一的面向对象的时间学习框架,用于多视角三维检测和跟踪任务。通过构建一个循环学习机制以提高多视角表示学习的鲁棒性,使模型预测的信息能够向后传播,从而减小历史帧中与目标无关的区域的响应,降低污染未来帧的风险并提高时间融合的对象感知能力。我们进一步根据循环学习模型,针对跟踪问题定制了一个面向对象的关联策略。所提出的循环学习方法和关联模块共同构成了一个新颖而统一的多任务框架。在nuScenes上的实验证明,所提出的模型在检测和跟踪评估上相对于不同设计(如基于密集查询的BEVFormer,基于稀疏查询的SparseBEV和基于LSS的BEVDet4D)的基线模型都取得了一致的性能提升。