PLUMENet:基于立体图像的高效 3D 物体检测
通过提出一个伪立体式的三维检测框架,包括三种新颖的虚拟视图生成方法和基于视差动态卷积的特征滤波,从单张图片中进行三维物体检测,该方法在 KITTI-3D 基准测试中获得了车辆、行人和骑行者三个类别的第一名。
Mar, 2022
本文提出一种基于卷积神经网络将基于图像的深度图转换为假激光雷达(pseudo-LiDAR)表示的方法,从而使得使用便宜的单 ocular 或立体成像数据进行 3D 物体检测时的精度在 KITTI 数据集上大幅提高到了 22% 到 74%。
Dec, 2018
本文提出了一种基于可微分的表示变换模块的框架,使得 3D 物体检测与深度估计的深度神经网络能够在此统一的框架中进行端到端的训练,该框架与大多数目前最先进的神经网络兼容,并在 KITTI 基于图像的 3D 物体检测排行榜上获得最高名次。
Apr, 2020
本文提出一种基于伪激光雷达(pseudo-LiDAR)的物体三维检测方法,通过改进其立体深度估计的网络结构和损失函数,以及通过利用稀疏的廉价激光雷达传感器的测量结果来传播深度估计值,从而实现对目标的准确检测。在 KITTI 数据集上的实验表明,该方法相比现有方法在远处物体检测精度上有 40% 以上的提升。
Jun, 2019
本文利用立体图像对 3D 目标进行检测,通过能量函数优化,使用 CNN 进行目标检测和姿态估计,实现在 KITTI 测试中的最佳表现,并应用 LIDAR 信息进一步优化检测结果。
Aug, 2016
本文介绍了一种称之为 DD3D 的单阶段,端对端的单目 3D 对象检测器,能够借助深度预训练提升准确性并解决如伪激光雷达方法的限制,通过深度估计和三维检测之间的有效信息传输,在大规模无标记数据的帮助下,达到了 KITTI-3D 基准测试中的 16.34%和 9.28%AP 的最新结果,以及在 NuScenes 中的 41.5%mAP。
Aug, 2021
提升单目深度学习算法中对于三维场景物体检测的表现,通过伪 LIDAR 点云实现与 LIDAR 算法的融合,最终在 KITTI 基准测试中取得了最优结果。
Mar, 2019
本研究揭示出 Pseudo-LiDAR 方法训练出的验证结果存在显著偏差,首次提出了 3D 置信度预测模块,利用该模块可以成功地与 RGB 3D 检测方法相结合,并证明新设计的 3D 置信度测量方法可以获得最先进性能。
Dec, 2020
研究采用一种新型 2D 框和以物体为中心的立体匹配方法,通过测量目标物体的视差来解决当前立体匹配网络固有的偏差问题,从而实现自主驾驶中的 3D 对象检测。
Sep, 2019
提出了一种结合单目和基于点云的三维检测的平衡方法,使用低成本、低分辨率的传感器获取仅有 512 个点,然后将这有限的三维信息与单张图像结合重建完整的三维点云,通过与多模态现成的三维检测器结合使用,使得三维检测的准确率相比于最新的单目检测方法提高了 20%,相对于基准多模态方法在 KITTI 和 JackRabbot 数据集上提高了 6% 到 9%。
Apr, 2024