EasyTrack:高效紧凑的单流 3D 点云跟踪器
在本文中,我们介绍了 BEVTrack,一个简单但强大的三维单目标跟踪基线框架。通过将连续的点云转换成常见的鸟瞰图表示,BEVTrack 通过简单的逐元素操作和卷积层,天然地编码了空间邻近性并熟练地捕捉运动线索,同时直接学习目标的运动分布,而无需假定固定的拉普拉斯或高斯。BEVTrack 在 KITTI 和 NuScenes 数据集上取得了最先进的性能,并且推理速度高达 122 帧 / 秒。
Sep, 2023
本文提出了一种基于运动中心范例的两阶段跟踪方法 M^2-Track 来解决传统外观匹配法在 LiDAR 点云跟踪中的不足,并在 KITTI、NuScenes 和 Waymo Open Dataset 三个数据集上表现出显著的精度提升(分别为 8%、17%和 22%),验证了该方法的有效性和前景。
Mar, 2022
3D 单目标跟踪是计算机视觉的前沿任务之一,本研究提出了一种基于点云的全新 3D 单目标跟踪框架 M3SOT,通过多个输入帧、多个感受野和多个解决空间的协同作用,从点云中直接建模时间性、上下文信息和任务,以实现高效的目标跟踪应用。M3SOT 的实验表明,在 KITTI、nuScenes 和 Waymo Open Dataset 等基准上,其性能达到了最先进的水平,帧率达到了 38 帧每秒。
Dec, 2023
我们提出了一种基于 pillar 的 3D 单物体跟踪框架 PillarTrack,通过将稀疏的点云转化为稠密的 pillar 来保留本地和全局几何特征,并引入了一种金字塔型编码 pillar 特征编码器(PE-PFE)设计以提高每个 pillar 的特征表示,并从模态差异的角度介绍了一种高效的基于 Transformer 的骨干网络。通过在 KITTI 和 nuScenes 数据集上进行广泛实验,我们的方法表现卓越,并实现了实时跟踪速度。我们希望我们的工作能够鼓励社区重新思考现有的 3D 单物体跟踪器设计。
Apr, 2024
SeqTrack3D 是一种基于 Sequence-to-Sequence 追踪范式的 3D 单目标追踪器,通过结合历史点云和边界框序列以确保鲁棒追踪,即使在稀疏点场景中也能利用历史边界框位置先验知识。在大规模数据集上的广泛实验表明,SeqTrack3D 实现了最新的最佳性能,NuScenes 上提高了 6.00%,Waymo 数据集提高了 14.13%。
Feb, 2024
PointTrackNet 使用机器学习技术构建一个端到端的 3D 目标检测和跟踪网络,在处理极端运动状态下的 KITTI 跟踪数据集时表现卓越。
Feb, 2020
本研究提出了一种基于 SimTrack 的 3D 多目标跟踪系统,旨在简化手工制作的跟踪范例,通过使用端到端可训练的模型从原始点云中进行联合检测和跟踪,无需启发式匹配步骤,将跟踪对象的关联,新生对象的检测和死亡轨迹的消除集成为一个统一的模型。
Aug, 2021
本文提出了一种基于多帧点云输入的 3D 单物体跟踪方法,能够编码目标的时空信息、学习目标的运动信息,且采用稀疏注意力机制进行特征融合,在 uiti 和 NuScenes 数据集上均取得了具有竞争力的结果。
Jun, 2023
本文使用 Siamese Transformer 网络,结合点云的形态信息和深度信息,在 3D 单目标跟踪任务中实现了鲁棒的交叉相关学习,取得了与 KITTI、nuScenes 和 Waymo 数据集上最优的表现。
Jul, 2022
通过引入统一模型从不同角度研究 3D 对象跟踪,本文针对点云对象的属性差异设计了 AdaFormer 网络,并在学习目标中加入了已知模板目标的大小和形状先验知识,提高了模型的推广能力。结果表明,统一模型在 KITTI 数据集上相对于特定类别模型在 Siamese 和 motion 范例上分别提高了 12% 和 3% 的性能。
Jan, 2024