- AAAIVoxel R-CNN:面向高性能体素化三维目标检测
本文提出了一种基于体素的框架 ——Voxel R-CNN,通过从体素特征中提取 RoI 特征,实现与最先进的基于点的模型相当的检测准确度,但计算成本只有一小部分,并在 KITTI 数据集上实现了更高的检测准确度和实时图像处理速率。
- 基于语义图的三维点云地点识别
本文提出了一种基于语义图的三维点云场景识别方法,该方法具有鲁棒性,能够应对遮挡和视角变化等环境变化,评估结果表明该方法优于现有技术。
- ECCV三维多目标跟踪的图神经网络
本研究提出了一种基于图神经网络和联合特征提取的 3D 多物体跟踪算法,通过在 KITTI 数据集上的实验验证,取得了最先进的 3D MOT 性能。
- ECCV重新思考伪 LiDAR 表征
通过深入研究,观察到伪激光雷达表示法的功效来自于坐标变换,作者设计了一种名为 Patch-Net 的基于图像的 CNN 探测器,其具有更广泛的适用性并可作为伪激光雷达的 3D 探测器。PatchNet 的伪激光雷达数据是以图像表示的,可以轻 - ECCV标签不完美:通过标签不确定性提高概率目标检测
本研究利用以前方法估计地面真实边框参量的不确定性来改进激光雷达概率目标检测器的检测准确性。实验结果表明,我们的方法在平均精度方面比基线模型和基于简单启发式方法的模型提高了高达 3.6%。
- Forget About the LiDAR: 自监督深度估计与 MED 概率体积
提出一种名为 'Forget About the LiDAR (FAL)' 的自监督深度估计方法,使用 Mirrored Exponential Disparity probability volumes 训练深度估计器并提取 Mirror - 基于部件的点云三维物体检测数据增强
本文提出了基于局部的数据增强方法,即 PA-AUG,可以更好地利用 3D 标签的丰富信息来增强 3D 物体探测器的性能。该方法可用于所有类型的 KITTI 数据集,具有等效的增加训练数据 2.5 倍的效果,并且对损坏的数据也具有鲁棒性。
- CVPR自监督单眼深度估计的不确定性
本文提出的自监督方法能够在 KITTI 数据集上以最先进的精度预测深度图,并且能够用于在训练过程中估计深度图的不确定性。
- SAMP:用于四维车辆重建的形状和运动先验
使用三维形状和运动先验来规范车辆的轨迹和形状,并通过在序列立体图像中施加共同的形状和运动模型,从而实现对车辆的姿态和形状的推断,得到了在 KITTI 数据集上的最新成果。
- 基于 LiDAR 的三维目标检测的数据增强定量化
本文研究了 LiDAR 技术的数据增强技术,探讨了全局和局部增强技术的不同使用方式,通过在 KITTI 数据集上的实验表明了两种数据增强技术都有可能促进 3D 目标检测方法的性能,但个别增强技术例如物体平移对全局性能有负面影响,作者认为这些 - SMOKE: 基于关键点估计的单阶段单目三维物体检测
本篇论文提出了一种名为 SMOKE 的新型 3D 对象检测方法,该方法结合单点估计和回归 3D 变量来预测每个检测到的对象的 3D 边界框,不需要复杂的前 / 后处理、额外的数据和细化阶段,并且在 KITTI 数据集上性能优于现有的单目 3 - 3DSSD:基于点云的三维单级物体检测器
本文提出一种名为 3DSSD 的轻量级且高效的基于点云的三维单级物体检测器,采用了融合采样策略以及候选生成层、无锚点回归头、三维中心性分配策略的结构设计,其精度和速度都表现出很好的平衡,并且在 KITTI 和 nuScenes 数据集上取得 - AAAI使用三重注意力从点云中进行强健的三维目标检测
本文探究了点云中三维物体检测的鲁棒性问题,引入了一种新的 TANet 模型,其中 Triple Attention 模块和 Coarse-to-Fine Regression 模块的结合提高了模型性能,实验结果在 KITTI 数据集上排名第 - 视觉里程计再探:应该学习什么?
本文提出了一种单目视觉里程计算法,它结合了基于几何方法和深度学习的思想,并利用两个卷积神经网络进行深度估计和光流估计。在 KITTI 数据集上的实验表明,该算法具有较强的鲁棒性和良好的性能。
- BoxNet:基于深度学习的从鸟瞰视角点云估计二维边界框方法
提出了一种基于深度学习的方法来从 2D 鸟瞰图 (LiDAR 点云) 中估计物体的边界框,该方法称为 BoxNet,可以高效地处理无序点云并且有效地解决了角度不连续的问题。该方法不像现有方法那样依赖于点的顺序,并且通过对训练数据中获得的先验 - STD: 稀疏到稠密的点云三维物体检测器
通过 KTTI 数据集,我们使用 STD 模型实现了一个高效的两阶段 3D 目标检测方法,包括 bottom-up 的提议生成和 IoU 的边框预测,出色地表现在较难的设置中。
- ICCVM3D-RPN: 单目三维区域建议网络用于目标检测
本研究提出了一种基于几何关系的 monocular 三维物体检测方法,通过单独的三维区域建议网络和深度感知卷积层,能够有效地改善基于图像的三维物体检测在自动驾驶领域中的表现。在 KITTI 数据集上,与其他之前的方法相比,M3D-RPN 方 - CVPR三角化学习网络:从单目到立体 3D 物体检测
本文研究从立体图像中检测 3D 物体的问题,提出了使用 3D 锚点构建物体级对应的方法来增强检测和定位的深度神经网络,使用经济高效的渠道重新加权策略来增强表示特征。在 KITTI 数据集上,这些方法都优于现有方法。
- 基于 RGB 和 LiDAR 融合的自动驾驶 3D 语义分割
本文旨在研究基于传感器融合技术的三维语义分割,将 RGB 图像转化为 LiDAR 所使用的极坐标网格映射表示,并设计了早期和中期融合架构,同时提出了融合两种算法的混合融合结构。在 KITTI 数据集中评估了所提出算法的效果,并相对于仅使用 - 基于关键点几何推理的单目三维物体检测
本篇研究提出了一种基于关键点的方法,利用单个 RGB 图像进行三维目标检测和定位,该网络基于 2D 关键点检测和几何推理方法,同时估计 2D 特征和全局 3D 姿态,最终在 KITTI 数据集中达到了最好的性能表现。