无人机跟踪的多步骤时间建模
本文提出了一种全面利用时间上下文进行航空追踪的框架,名为 TCTrack,该框架在特征提取和相似度图优化方面使用了时间上下文。实验表明,TCTrack 在四个航空追踪基准测试数据集上的效果令人印象深刻,并且在 NVIDIA Jetson AGX Xavier 上实现了高达 27 FPS 的高速。
Mar, 2022
本文提出了一个基于 transformer 的视频物体跟踪器,在 Siamese-like 跟踪管道中,编码器在模板中注入了基于注意力机制的特征强化以增强模型生成质量,解码器传递上一个模板的跟踪线索到当前帧以方便目标搜索,结果本方法作为一种最先进的记录在普遍跟踪基准上获得了成功。
Mar, 2021
提出了一种自适应在线学习以提高无人机(UAV)目标跟踪和定位的方法,该方法通过引入空间本地响应地图变化作为空间正则化,并使用全局响应地图变化来确定滤波器的更新速率,优于基于 CPU 和 GPU 的跟踪器,速度为每秒约 60 帧,具有较高的有效性和多功能性。
Mar, 2020
该研究提出了一种多模态无人机追踪和位姿估计方法,通过利用多模态传感器信息,包括立体视觉、各种雷达和音频阵列,以及针对无人机检测、分类和 3D 跟踪的困难,提高了准确度和稳健性,并在 MMUAD 数据集的分类和跟踪任务中取得了最好的性能。
May, 2024
本文介绍了一种名为 PF-Track 的多相机 3D 多目标跟踪框架,它重点强调时空连续性,过去和未来的推理,采用 “注意跟踪” 框架,并使用对象查询一致地表示跟踪实例,以明确使用历史线索,显式地引用前面帧和其他对象的查询,从而学习优化轨迹并增强物体特征。
Feb, 2023
提出一种全局在线多目标多摄像头(MTMC)跟踪模型,解决了多目标多摄像头跟踪中第一阶段跟踪结果的依赖性和跨摄像头匹配的困难,同时通过特征提取和融合模块增强了特征表示,建立了多摄像头目标之间的相关性,取得了在 VisionTrack 数据集和其他数据集上较之前方法的显著改进。
Jul, 2024
使用 Transformer 和时空嵌入的 MO3TR 方法,具有空间和时间注意机制,无需显式的数据聚类模块或任何启发式方法,成功解决了多物体追踪过程中的诸多挑战,表现方面同多个 popular MOT 图像和视频基准测试的现有最先进技术几乎相当或更好。
Mar, 2021
提出了一种基于运动的多目标跟踪方法,称为 ETTrack,它融合了变换器模型和时间卷积网络,利用历史运动信息预测个体物体的未来运动,并通过新颖的动量修正损失函数提高了预测准确性,实验证明 ETTrack 在 DanceTrack 和 SportsMOT 上取得了与最先进跟踪器竞争性的性能,分别达到 56.4%和 74.4%的 HOTA 指标。
May, 2024
提出了一个自适应的带有时空转换器的跟踪器(命名为 AQATrack),通过采用简单的自回归查询来有效地学习时空信息,从而改善了目标跟踪中手动设计组件过多的问题,并设计了新颖的注意力机制来生成当前帧的新查询,最终使用空间 - 时间信息融合模块(STM)定位目标对象,实验结果表明,该方法在六个流行的跟踪基准上显著提高了跟踪器的性能:LaSOT、LaSOText、TrackingNet、GOT-10k、TNL2K 和 UAV123。
Mar, 2024