通过预测物体移动来学习时间线索的多摄像头三维物体检测

Apr, 2024

通过预测物体移动来学习时间线索的多摄像头三维物体检测

Learning Temporal Cues by Predicting Objects Move for Multi-camera 3D Object Detection

Seokha Moon, Hongbeen Park, Jungphil Kwon, Jaekoo Lee, Jinkyu Kim

TL;DR在自动驾驶和机器人技术中，利用短期历史数据增强多摄像头 3D 物体检测的兴趣日益增长，通过利用输入视频流的连续且相关性质来实现。最近的研究集中在基于 BEV（鸟瞰图）的特征在时间步内的空间对齐上。然而，由于长期过去的观测没有良好的扩展效果，这方面的工作通常受限。为了解决这个问题，我们提出了一种名为 DAP（预测后检测）的模型，包括两个分支网络：（一）一个分支负责根据过去的观测预测当前物体的位置，（二）另一个分支基于当前和过去的观测来检测物体。从分支（一）预测当前物体的特征被融合到分支（二）中以传递预测性知识。我们在大规模的 nuScenes 数据集上进行了广泛的实验，并观察到利用这种预测信息显著提高了整体检测性能。我们的模型可以即插即用，表现出一致的性能提升。

Abstract

In autonomous driving and robotics, there is a growing interest in utilizing short-term historical data to enhance multi-camera

autonomous driving robotics 3d object detection historical data temporal cues

发现论文，激发创造

预测为基础的三维物体检测：使用连续图像

本文提出了一种名为 P2D 的新型三维物体检测模型，它将预测方案整合到检测框架中，显式提取和利用运动特征，以及引入基于预测物体信息的 Bird's-Eye-View（BEV）特征的新型时间特征聚合方法，结果表明，与基线相比，P2D 可以显著提高检测精度。

Jun, 2023

历史物体预测增强的多视角 3D 物体检测器的时序优化训练

历史物体预测 (HoP) 新范式为多视角三维检测提供了更有效地利用时间信息的方法。我们的方法采用了短期和长期的时间解码器，并生成伪鸟瞰图特征，以预测历史时刻的物体集。在 NuScenes 数据集上的实验表明，与目前领先的三维物体检测器相比，HoP 可以有效提高检测性能。

Apr, 2023

自主车辆上的移动多相机多 3D 物体跟踪

本文提出了一个新的全局关联图模型与链接预测方法，以预测现有的 tracklets 位置并通过交叉注意力运动建模和外观重新识别将检测与 tracklets 链接起来，以解决由于不一致的 3D 对象检测引起的问题，并提高 nuScenes 检测挑战中标准 3D 对象检测器的检测准确率。实验结果表明，该方法在现有基于视觉的跟踪数据集上表现出了 SOTA 的性能。

Apr, 2022

利用激光雷达进行未来物体检测预测

本研究提出了一种基于原始传感器测量而非基于标准轨迹的端到端方法来进行对象检测和运动预测，实现对多个未来情况的推理能力，并扩展了检测度量来检验预测准确性。

Mar, 2022

利用物体运动预测实现未来视频合成

利用背景场景和移动物体的非刚性变形和仿射变换对未来视频帧进行预测，实现较低的变形失真，并在 Cityscapes 和 KITTI 数据集上呈现更高的视觉质量和准确性。

Apr, 2020

物体不消失：通过单帧物体位置预测的视频物体检测

通过利用连续平滑的运动，我们在三个方面进行了改进：1）通过将对象运动作为额外的监督来源，从静态关键帧中预测对象位置来提高准确性。2）通过仅在少量帧中进行昂贵的特征计算来提高效率。3）通过仅注释关键帧并利用关键帧之间的平滑伪运动来减少注释成本。我们在四个数据集上展示了计算效率、注释效率和改进的均值平均精度，分别是 ImageNet VID，EPIC KITCHENS-55，YouTube-BoundingBoxes 和 Waymo Open dataset。我们的源代码可在此 https URL 找到。

Aug, 2023

站在过去和未来之间：多摄像头 3D 多物体跟踪的时空建模

本文介绍了一种名为 PF-Track 的多相机 3D 多目标跟踪框架，它重点强调时空连续性，过去和未来的推理，采用 “注意跟踪” 框架，并使用对象查询一致地表示跟踪实例，以明确使用历史线索，显式地引用前面帧和其他对象的查询，从而学习优化轨迹并增强物体特征。

Feb, 2023

利用具有空间感知的深度关注模型进行人类轨迹预测

提出了一种端到端的基于深度学习的模型，该模型使用来自不同导航模式的数据直接学习人类的运动模式，包括一个软关注机制和一种新颖的方法来预测动态轨迹，同时还考虑了场景中的静态物体存在，通过在行人轨迹数据集上的测试结果显示，可以显著优于现有的最新技术水平，也可以自然地扩展到同时处理多个移动模式。

May, 2017

利用播放回归进行无监督领域自适应的三维物体检测

本研究提出了一种新的学习方法通过在原始领域的伪标签上微调探测器来减少自动驾驶汽车在不同环境下的识别差异，据此，研究发现在五组自动驾驶数据集中，探测器在伪标签领域上的微调显著降低了探测器在新的行驶环境中的误判率。

Mar, 2021

基于时序图神经网络的半监督三维物体检测

通过时态图神经网络的半监督学习，利用大量未标注的点云视频进行 3D 物体探测，实现了比基线和同等标记数据下的最新检测性能更好的检测，关键词：3D 物体探测；半监督学习；时态图神经网络；未标注数据；最新检测性能。

Feb, 2022