关键词camera-based 3d object detection
搜索结果 - 4
- 通过级联深度估计和校准实现准确的基于摄像头的 3D 物体检测
本文提出了一个基于相机的 3D 目标检测的级联框架,通过深度估计和深度校准来有效地学习深度信息,实现从 2D 到 3D 空间的特征提取和目标定位。在多个检测器上进行广泛实验,取得了较高的性能表现。
- 预测为基础的三维物体检测:使用连续图像
本文提出了一种名为 P2D 的新型三维物体检测模型,它将预测方案整合到检测框架中,显式提取和利用运动特征,以及引入基于预测物体信息的 Bird's-Eye-View(BEV)特征的新型时间特征聚合方法,结果表明,与基线相比,P2D 可以显著 - 通过遮蔽图像建模实现更好的三维知识转移,用于多视角三维理解
本文提出了一种名为 GeoMIM 的多相机视觉转换器,通过预训练 - 微调的方法将 LiDAR BEV 模型的知识传递给 GeoMIM,以改善多视图基于相机的三维检测,并在 nuscenes 基准测试中取得了最新的表现。
- ECCV利用光线追踪学习自我三维表示
本篇论文提出了一种新的端对端架构,可以从任意数量的不受约束的相机视图中学习 3D 表征,无需深度监督,并且具有与 BEV 相关的内置几何结构,该模型在标准 BEV 视觉任务(例如基于相机的 3D 物体检测和 BEV 分割)中具有优异的性能。