FlowTrack:3D 单目标跟踪的点级流网络
3D 单目标跟踪是计算机视觉的前沿任务之一,本研究提出了一种基于点云的全新 3D 单目标跟踪框架 M3SOT,通过多个输入帧、多个感受野和多个解决空间的协同作用,从点云中直接建模时间性、上下文信息和任务,以实现高效的目标跟踪应用。M3SOT 的实验表明,在 KITTI、nuScenes 和 Waymo Open Dataset 等基准上,其性能达到了最先进的水平,帧率达到了 38 帧每秒。
Dec, 2023
本文提出了一种基于 LiDAR 的三维多目标跟踪框架 FlowMOT,该框架结合了点运动信息和传统的匹配算法,通过使用匈牙利算法生成最优匹配关系来完成跟踪任务。实验结果表明,该方法胜过最近的端到端方法,并且在各种速度场景下可以稳定地工作。
Dec, 2020
SeqTrack3D 是一种基于 Sequence-to-Sequence 追踪范式的 3D 单目标追踪器,通过结合历史点云和边界框序列以确保鲁棒追踪,即使在稀疏点场景中也能利用历史边界框位置先验知识。在大规模数据集上的广泛实验表明,SeqTrack3D 实现了最新的最佳性能,NuScenes 上提高了 6.00%,Waymo 数据集提高了 14.13%。
Feb, 2024
通过 EasyTrack 提出一种新的一次性转换器 3D SOT 范例,利用点云跟踪特征预训练模块、统一的 3D 跟踪特征学习和融合网络,以及在密集鸟瞰特征空间中构建的目标定位网络,显著提高了 KITTI、NuScenes 和 Waymo 的性能,并具有较低的参数和高帧率。
Apr, 2024
本文介绍了 DOT,一种新颖、简单且高效的方法,用于解决点追踪中存在的遮挡问题,并且通过最近邻插值计算粗糙的初始估计密集流场和可见性掩码,然后利用可学习的光流估计器对其进行精细化处理。实验证明 DOT 相较于当前的光流技术更加准确,在速度方面至少快两个数量级。
Dec, 2023
在本文中,我们介绍了 BEVTrack,一个简单但强大的三维单目标跟踪基线框架。通过将连续的点云转换成常见的鸟瞰图表示,BEVTrack 通过简单的逐元素操作和卷积层,天然地编码了空间邻近性并熟练地捕捉运动线索,同时直接学习目标的运动分布,而无需假定固定的拉普拉斯或高斯。BEVTrack 在 KITTI 和 NuScenes 数据集上取得了最先进的性能,并且推理速度高达 122 帧 / 秒。
Sep, 2023
本文提出了一种基于运动中心范例的两阶段跟踪方法 M^2-Track 来解决传统外观匹配法在 LiDAR 点云跟踪中的不足,并在 KITTI、NuScenes 和 Waymo Open Dataset 三个数据集上表现出显著的精度提升(分别为 8%、17%和 22%),验证了该方法的有效性和前景。
Mar, 2022
本文提出了一种基于多帧点云输入的 3D 单物体跟踪方法,能够编码目标的时空信息、学习目标的运动信息,且采用稀疏注意力机制进行特征融合,在 uiti 和 NuScenes 数据集上均取得了具有竞争力的结果。
Jun, 2023
我们提出了一种基于 pillar 的 3D 单物体跟踪框架 PillarTrack,通过将稀疏的点云转化为稠密的 pillar 来保留本地和全局几何特征,并引入了一种金字塔型编码 pillar 特征编码器(PE-PFE)设计以提高每个 pillar 的特征表示,并从模态差异的角度介绍了一种高效的基于 Transformer 的骨干网络。通过在 KITTI 和 nuScenes 数据集上进行广泛实验,我们的方法表现卓越,并实现了实时跟踪速度。我们希望我们的工作能够鼓励社区重新思考现有的 3D 单物体跟踪器设计。
Apr, 2024
PointTrackNet 使用机器学习技术构建一个端到端的 3D 目标检测和跟踪网络,在处理极端运动状态下的 KITTI 跟踪数据集时表现卓越。
Feb, 2020