离线实时追踪
该论文提出了一种端到端可训练的方法,结合物体检测和跟踪,并引入了序列记忆模块,使其更好地处理多物体跟踪,尤其是遮挡的情况。经过大规模的合成数据和实际测试,在 KITTI 和 MOT17 数据集上取得了最先进的性能表现。
Mar, 2021
在这篇论文中,我们考虑将不可见的物体视为伪遮挡物体,并旨在揭示它们的特征。我们提出了可视属性和自动标注算法来处理现有事件相机数据集,并利用跟踪策略来保持伪遮挡物体的永久性和边界框,同时引入了时空特征聚合模块和一致性损失以提高整体流程的稳健性。实验证明,额外的可见性标签可以辅助有监督训练,并且我们的方法在绝对 mAP 上比最先进的方法表现出显著的改进,提高了 7.9%。
Mar, 2024
通过数据学习目标物体的位置推测,需要拆分成四个子任务,其中第四个子任务最具挑战性,因为它需要一个系统来推理不可见物体的移动位置,本文介绍了一个统一的深度架构,可以在四种情况下学习预测物体位置,并在基于 CATER 的新数据集上对其进行评估,发现它优于以前的定位方法和各种基线。
Mar, 2020
本文旨在提高离线基于 LiDAR 的三维物体检测的性能,提出了一种新的基于轨道中心的检测器 CTRL,并设计了一个双向跟踪模块和一个轨道中心学习模块,实现了 “一旦检测,永不失误” 的特征。大量实验表明,我们的方法在竞争激烈的 Waymo Open 数据集中超越了人类注释的准确性和以往最先进的方法。
Apr, 2023
针对多目标跟踪中的遮挡问题,本文提出了一种考虑遮挡的检测和 Re-ID 校准网络,名为 ORCTrack。通过引入 Occlusion-Aware Attention 模块和优化传输问题的 Re-ID 匹配块,该方法在 VisDrone2021-MOT 和 KITTI 数据集上实验表明了其卓越性能和高运行效率。
Aug, 2023
通过融合 2D 图像与 3D LiDAR 点云的特征,学习度量,以及在无匹配目标检测时初始化跟踪,提出了一种概率、多模态、多对象跟踪系统,实现了比现有技术更鲁棒、数据驱动的多对象跟踪。
Dec, 2020
该研究提出了一种视频基于物体为中心的模型,通过适应物体为中心的插槽以及构建完整物体原型来处理遮挡,仅需要稀疏的检测标签进行物体定位和特征绑定,无需 ID 标签,并通过自我监督的期望最大化损失函数实现物体关联,实验证明了该方法在物体为中心的学习领域的卓越性能。
Sep, 2023
这篇论文介绍了一种从单目 RGB-D 学习 4D 视觉表示估计的框架,通过将点云编码成连续表示,该模型能够在时空上跨越上下文从而解决遮挡问题,实验证明这种方法可以成功地处理遮挡问题,并自动学习跟随遮挡物体的注意机制,可以用于许多视频理解任务。
Apr, 2022
在本文中,我们提出了一种名为 MapTrack 的方法,利用概率图、预测图和协方差自适应卡尔曼滤波器的三个轻量级插件算法,通过增强经典跟踪器 DeepSORT 在拥挤和遮挡场景中的鲁棒性,实现在常用的多目标跟踪基准集(如 MOTS17 和 MOT20)上的最先进效果。
Feb, 2024
通过引入 TAO-Amodal 基准测试数据集,并利用轻量级插件模块,amodal 扩展器,通过数据增强和少量视频序列的微调,我们在 TAO-Amodal 上分别实现了 3.3%和 1.6%对遮挡物体的检测和跟踪改善,并在人物方面相较于现有模态基线实现了巨大 2 倍的改进。
Dec, 2023