使用 RGB-D 或 深度图像的锥体 VoxNet 3D 物体检测
本文探讨了利用深度学习在 3D 物体检测中,针对使用 RGB-D 数据在室内和室外场景下进行点云识别所面临的挑战以及如何提高效率。通过利用成熟的 2D 物体检测器和先进的 3D 深度学习来提高区域建议与对象本地化的精度,以取得高回收甚至小目标检测的良好性能。在 KITTI 和 SUN RGB-D 3D 检测基准上进行了评估,相比现有技术取得了显著的大幅度升级,并具有实时性能。
Nov, 2017
VoxelNet 是一种针对点云图像检测的深度网络,可以将点云分割成等间距的三维体素,并通过新引入的体素特征编码层将每组点转换为统一的特征表示,从而生成描述性的体积表示,并连接 RPN 以生成检测。
Nov, 2017
本研究提出了一种基于 LIDAR 传感器的一阶段 3D 目标检测器,该检测器在从点数据中提取特征上表现出更好的性能,并在 KITTI-3D 基准测试中表现优异,其速度和准确性在实际场景中具有实际应用价值。
Jun, 2019
本文提出了一种基于体素的框架 ——Voxel R-CNN,通过从体素特征中提取 RoI 特征,实现与最先进的基于点的模型相当的检测准确度,但计算成本只有一小部分,并在 KITTI 数据集上实现了更高的检测准确度和实时图像处理速率。
Dec, 2020
该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks(MV3D)框架,该框架采用多传感器融合技术,将 LIDAR 点云和 RGB 图像作为输入,并预测有方向的 3D 界限框。实验表明,该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25%和 30%,在 2D 检测中也表现出显著的技术优势。
Nov, 2016
介绍了一种联合训练 3D 目标检测和单目稠密深度重建神经网络的方法,通过 LiDAR 点云和单个 RGB 图像生成物体姿态预测和密集重建深度,其中 LiDAR 点云被转换为一组体素并使用 3D 卷积层提取特征,通过另一个 2D 卷积神经网络提取相应的 RGB 图像特征,并使用这些组合特征来预测密集深度图。
Apr, 2021
该研究提出了一种基于 3D 体素特征的中心点检测方法,其中包括一个有效的粗细重建模块,可从单个 2D 图像中检测和重建多个物体的 3D 位置和形状。
Nov, 2021
该论文提出了一种解决方案,通过实现快速动态体素化器,以便在快速基于柱体模型中像体素化器在缓慢的基于体素模型中工作一样工作,实现网络推理速度和精度的提高。此外,作者还提出了轻型检测子头模型来分类预测的物体,并过滤出虚假的检测物体,从而显著提高模型的精度,在可忽略的时间和计算成本内。
Jan, 2023
提出了一种名为 PointVoxel-RCNN(PV-RCNN)的 3D 物体检测框架,可以使用点云实现准确的物体检测,使用了 3D voxel 卷积神经网络和基于 PointNet 的集合抽象相结合的方法深度学习了更具有区分性的点云特征,并使用 RoI-grid 池化方法编码具有可比性的特征从而实现了更准确的 3D 检测效果。
Dec, 2019