自主驾驶的多传感器三维物体框细化

Sep, 2019

自主驾驶的多传感器三维物体框细化

Multi-Sensor 3D Object Box Refinement for Autonomous Driving

Peiliang Li, Siqi Liu, Shaojie Shen

TL;DR本文提出了一种在自动驾驶背景下具有多传感器优化的三维目标检测系统，其中单眼相机可以作为二维目标提议和初步三维边界框预测，而立体相机和 LiDAR 则被视为自适应插件传感器以优化 3D 边界框本地化性能。

Abstract

We propose a 3d object detection system with multi-sensor refinement in the context of autonomous driving. In our framework, the monocular

3d object detection multi-sensor refinement autonomous driving stereo cameras lidar

发现论文，激发创造

三维障碍多摄像头系统的联合目标检测与重新识别

近年来，自动驾驶领域取得了显著进展，本文提出一种新颖的修改方法，利用摄像机和激光雷达信息，将额外的分支整合到目标检测网络中，用于在同一车辆中的相邻摄像头之间重新识别物体，同时提高基线 3D 目标检测结果的质量。经过广泛实验验证，该方法在 2D 和 3D 领域的有效性得到证实，结果表明该方法优于传统的非最大抑制（NMS）技术，在重叠区域的车辆类别中改进超过 5%。

Oct, 2023

GS3D：面向自动驾驶的高效三维物体检测框架

本文提出了一种基于单个 RGB 图像的高效三维目标检测框架，旨在从二维图像中提取三维信息并在无点云或立体数据的情况下确定对象的精确三维边界框。该方法利用二维目标检测器提取表面视觉特征，消除使用二维边界框带来的表征歧义问题，并探索了不同的三维边界框细化方法，发现基于质量感知损失的分类式方法具有更好的性能。在 KITTI 基准测试上，该方法优于当前单个 RGB 图像基础的三维目标检测技术水平。

Mar, 2019

用于自动驾驶的多视角三维物体检测网络

该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks（MV3D）框架，该框架采用多传感器融合技术，将 LIDAR 点云和 RGB 图像作为输入，并预测有方向的 3D 界限框。实验表明，该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25％和 30％，在 2D 检测中也表现出显著的技术优势。

Nov, 2016

高级相机 - LiDAR 融合与机器学习的 3D 物体检测

本研究提出了一种使用单目摄像头和 LiDAR 数据结合的机器学习技术，通过以国际排名领先的二维物体探测器生成的锥体区域来分割 LiDAR 点云，从而检测运动平台周围的车辆的 3D 边界框参数，最终验证集准确率达到 87.1％。

May, 2021

Object-Centric Stereo Matching for 3D Object Detection

研究采用一种新型 2D 框和以物体为中心的立体匹配方法，通过测量目标物体的视差来解决当前立体匹配网络固有的偏差问题，从而实现自主驾驶中的 3D 对象检测。

Sep, 2019

多模态虚拟点 3D 检测

通过无缝融合 RGB 传感器到 Lidar 的 3D 识别中，我们提出了一个简单而有效的多模态检测器，该方法利用一组 2D 检测生成密集的虚拟 3D 点，能够增强原来稀疏的 3D 点云，实验结果在大规模 nuScenes 数据集上取得了显着的改进，并超过了竞争融合方法。

Nov, 2021

视角到标签：自监督三维物体检测的多视角一致性

提出了一种基于多视角和弱标签的纯 RGB 序列的自监督 3D 物体检测方法，其在 KITTI 3D 数据集上的性能与使用激光雷达或立体图像的最先进的自监督方法相当。

May, 2023

使用立体图像生成三维物体建议，实现准确的物体分类检测

本文利用立体图像对 3D 目标进行检测，通过能量函数优化，使用 CNN 进行目标检测和姿态估计，实现在 KITTI 测试中的最佳表现，并应用 LIDAR 信息进一步优化检测结果。

Aug, 2016

利用激光雷达点云的端到端三维物体检测

无人驾驶车辆中的目标检测与跟踪任务主要依靠相机和 LiDAR 等多种传感器，本研究在使用 LiDAR 点云的新编码方式基础上，通过推断自动驾驶车辆附近不同类别物体的位置，实现了对场景中物体位置和方向的预测。

Dec, 2023

自动驾驶用基于地面的单目三维物体检测

通过研究路面对 3D 检测提供的额外信息，提出了一种嵌入式神经网络，能够充分利用这些应用程序特定的先验知识，从而实现使用单个 RGB 摄像机确定环境中对象的位置和方向的三维目标检测。

Feb, 2021