Sep, 2023

基于移动视觉变压器的视觉目标跟踪

TL;DR使用 MobileViT 作为骨干网络并采用融合模板和搜索区域表示的新方法,我们提出了一种轻量级、准确和快速的跟踪算法。实验结果表明,我们的基于 MobileViT 的追踪器 MVT 在大规模数据集 GOT10k 和 TrackingNet 上的性能超过了最新的轻量级追踪器,并且具有较高的推理速度。此外,我们的方法在模型参数减少 4.7 倍并在 GPU 上运行速度为 DiMP-50 追踪器的 2.8 倍的情况下,胜过了流行的 DiMP-50 追踪器。