无人机跟踪的多步骤时间建模

Mar, 2024

Multi-step Temporal Modeling for UAV Tracking

Xiaoying Yuan, Tingfa Xu, Xincong Liu, Ying Wang, Haolin Qin...

TL;DRMT-Track 是一种高效的多步骤时间建模框架，用于增强无人机跟踪任务中的时间上下文，并通过独特的时间相关模块和互补转换模块来提高跟踪准确性。

Abstract

In the realm of unmanned aerial vehicle (UAV) tracking, Siamese-based approaches have gained traction due to their optimal balance between efficiency and precision. However, UAV scenarios often present challenges such as insufficient sampling resolution, fast motion and small objects with limited feature information. As a result, →

unmanned aerial vehicle tracking siamese-based approaches temporal context mt-track correlation maps

发现论文，激发创造

TCTrack: 航空跟踪的时间上下文

本文提出了一种全面利用时间上下文进行航空追踪的框架，名为 TCTrack，该框架在特征提取和相似度图优化方面使用了时间上下文。实验表明，TCTrack 在四个航空追踪基准测试数据集上的效果令人印象深刻，并且在 NVIDIA Jetson AGX Xavier 上实现了高达 27 FPS 的高速。

Mar, 2022

基于时间上下文的真实世界视觉跟踪

提出了一种利用时间上下文的双层框架 (TCTrack)，用于实现更强大的现实世界视觉跟踪，并在特征提取和相似度图优化方面进行了改进。

Aug, 2023

Transformer Meets Tracker: 挖掘时间上下文，提高鲁棒性视觉跟踪

本文提出了一个基于 transformer 的视频物体跟踪器，在 Siamese-like 跟踪管道中，编码器在模板中注入了基于注意力机制的特征强化以增强模型生成质量，解码器传递上一个模板的跟踪线索到当前帧以方便目标搜索，结果本方法作为一种最先进的记录在普遍跟踪基准上获得了成功。

Mar, 2021

AutoTrack：面向自动时空正则化的无人机高性能视觉跟踪

提出了一种自适应在线学习以提高无人机（UAV）目标跟踪和定位的方法，该方法通过引入空间本地响应地图变化作为空间正则化，并使用全局响应地图变化来确定滤波器的更新速率，优于基于 CPU 和 GPU 的跟踪器，速度为每秒约 60 帧，具有较高的有效性和多功能性。

Mar, 2020

多模态无人机检测、分类和跟踪算法 -- CVPR 2024 UG2 挑战技术报告

该研究提出了一种多模态无人机追踪和位姿估计方法，通过利用多模态传感器信息，包括立体视觉、各种雷达和音频阵列，以及针对无人机检测、分类和 3D 跟踪的困难，提高了准确度和稳健性，并在 MMUAD 数据集的分类和跟踪任务中取得了最好的性能。

May, 2024

站在过去和未来之间：多摄像头 3D 多物体跟踪的时空建模

本文介绍了一种名为 PF-Track 的多相机 3D 多目标跟踪框架，它重点强调时空连续性，过去和未来的推理，采用 “注意跟踪” 框架，并使用对象查询一致地表示跟踪实例，以明确使用历史线索，显式地引用前面帧和其他对象的查询，从而学习优化轨迹并增强物体特征。

Feb, 2023

GMT：一种适用于多目标多摄像头跟踪的鲁棒全局关联模型

提出一种全局在线多目标多摄像头（MTMC）跟踪模型，解决了多目标多摄像头跟踪中第一阶段跟踪结果的依赖性和跨摄像头匹配的困难，同时通过特征提取和融合模块增强了特征表示，建立了多摄像头目标之间的相关性，取得了在 VisionTrack 数据集和其他数据集上较之前方法的显著改进。

Jul, 2024

通过空间和时间变换器进行端到端多目标跟踪，超越两帧限制

使用 Transformer 和时空嵌入的 MO3TR 方法，具有空间和时间注意机制，无需显式的数据聚类模块或任何启发式方法，成功解决了多物体追踪过程中的诸多挑战，表现方面同多个 popular MOT 图像和视频基准测试的现有最先进技术几乎相当或更好。

Mar, 2021

ETTrack：增强的多目标跟踪时间性运动预测器

提出了一种基于运动的多目标跟踪方法，称为 ETTrack，它融合了变换器模型和时间卷积网络，利用历史运动信息预测个体物体的未来运动，并通过新颖的动量修正损失函数提高了预测准确性，实验证明 ETTrack 在 DanceTrack 和 SportsMOT 上取得了与最先进跟踪器竞争性的性能，分别达到 56.4％和 74.4％的 HOTA 指标。

May, 2024

自适应跟踪的自回归查询与时空 Transformer

提出了一个自适应的带有时空转换器的跟踪器（命名为 AQATrack），通过采用简单的自回归查询来有效地学习时空信息，从而改善了目标跟踪中手动设计组件过多的问题，并设计了新颖的注意力机制来生成当前帧的新查询，最终使用空间 - 时间信息融合模块（STM）定位目标对象，实验结果表明，该方法在六个流行的跟踪基准上显著提高了跟踪器的性能：LaSOT、LaSOText、TrackingNet、GOT-10k、TNL2K 和 UAV123。

Mar, 2024