Oct, 2023

利用图像相关的归纳偏见在单支视觉跟踪中的应用

TL;DR提出了一种自适应 ViT 模型预测跟踪器 (AViTMP),通过引入适配器模块和联合目标状态嵌入来丰富基于 ViT 的稠密嵌入范式,并结合了稠密融合解码器和判别式目标模型以预测准确位置。通过双向循环跟踪验证的循环跟踪方法 CycleTrack 增强了跟踪的鲁棒性,还提出了双帧更新推理策略以有效处理长期场景中的挑战。大量实验证明,AViTMP 在长时间跟踪和鲁棒性方面达到了最先进的性能。