点云预测作为 4D 占用预测的代理
本文提出了一种使用 3D LiDAR 扫描来预测未来点云的方法,该方法可用于实现自主移动系统的预测状态估计、避碰和规划,通过使用 2D 范围图像表示扫描数据并连接一系列范围图像来实现端到端的预测,最终通过 3D 卷积来预测未来的 3D 点云,并通过多个数据集进行实验验证,结果表明本文提出的方法比现有的点云预测结构更优且能够很好地适用于新的未知环境。
Sep, 2021
我们提出了一种使用自监督从 LiDAR 数据学习连续的 4D(时空)占据场的无监督世界模型,该模型可以轻松有效地迁移到下游任务,并在点云预测和 BEV 语义占据预测方面取得了最先进的性能,特别是在标注数据稀缺时。此外,在与先前的时空几何占据预测的最新技术进行比较时,我们的 4D 世界模型对于与自动驾驶相关的类别的对象的召回率要高得多。
Jun, 2024
由于视觉自主驾驶应用需要同时处理语义、3D 几何和时间信息以进行联合感知、预测和规划,因此我们提出了一种名为 “ViDAR” 的预训练模型,用于预训练下游视觉编码器,并通过新颖的隐变换操作将历史嵌入式表示转换为 3D 几何空间,以实现未来点云的预测。实验结果表明,在下游任务中取得了显著的增益,如在 3D 检测上的 NDS 提高了 3.1%,运动预测的错误率减少了约 10%,规划中碰撞率减少了约 15%。
Dec, 2023
本文提出了一种新的实时方法,基于三维点云序列,采用时间上下文聚合实现动态检测和运动参数估计,可适用于自动驾驶车辆在复杂城市环境下进行安全导航,不仅可以估计车辆或行人等常见道路参与者的运动,还可推广到其他没有在训练数据中出现的物体类别,并对不同的时间上下文聚合策略进行了深入的分析,提供了我们最先进模型与 KITTI 场景流数据集上现有解决方案的比较结果。
Apr, 2020
本文通过介绍新颖的无人驾驶 LiDAR 感知任务 OCF,将场景完整和预测问题统一为一个相互关联的框架,解决了稀疏到稠密重建、局部到完整幻觉和 3D 到 4D 预测等三个挑战,并分析了现有模型在 OCFBench 数据集上的表现,为进一步深入研究这一关键的四维感知领域提供了启发。
Oct, 2023
3D LiDAR 激光雷达点云的标注是耗时且耗能的,为了减轻标注的负担,本文提出了 SPOT 方法,该方法通过占据预测进行可扩展的预训练,从而学习可转移的 3D 表征,并在不同数据集和任务的标签效率设置下展示了其有效性。
Sep, 2023
本论文提出一种基于自监督学习的点云深度感知模型预训练方法,通过表面重建预训练任务和基于潜在向量的感知头来抓取表面信息的语义片段并提高对象检测和场景语义分割性能。
Dec, 2022
本文提出了一种基于学习的 3D 物体跟踪方法,通过从时间点云数据中学习物体对应关系和运动信息的模式,利用 lidar 数据和运动估计技术进行跟踪,以及采用简单有效的速度平滑模块对物体的运动进行估计,从而在 KITTI 和更大规模的 Nuscenes 数据集上优于现有的 3D 跟踪方法。
Oct, 2020