基于体素的单图像多物体三维检测和重建
本文提出了一种从单一 RGB 图像中检测和重构多个 3D 物体的方法,通过逐步优化检测、对齐和形状重构,选择最佳的几个候选形状,并采用轻量化的重构技术进行快速、端到端的训练。
Dec, 2020
本文提出了一种基于多层体素网格的端到端多级学习方法来解决现有 3D 目标识别中结构化和非结构化数据表示的缺陷,结果表明该方法在节约内存的同时能够实现与密集体素表示相当的目标识别性能。
May, 2018
介绍了一种联合训练 3D 目标检测和单目稠密深度重建神经网络的方法,通过 LiDAR 点云和单个 RGB 图像生成物体姿态预测和密集重建深度,其中 LiDAR 点云被转换为一组体素并使用 3D 卷积层提取特征,通过另一个 2D 卷积神经网络提取相应的 RGB 图像特征,并使用这些组合特征来预测密集深度图。
Apr, 2021
本文提出了一种适用于单目三维目标检测的新型基于物体的体素表示法,能够有效地组织噪点云在体素网格内,并能够精确定位对象在三维空间中的位置。通过考虑三维物体与相关二维框之间的关系,我们将单目三维目标检测中的置信度机制进行了分解,并在 KITTI 数据集上进行了评估,性能显著优于现有技术。
Apr, 2021
VoxelNet 是一种针对点云图像检测的深度网络,可以将点云分割成等间距的三维体素,并通过新引入的体素特征编码层将每组点转换为统一的特征表示,从而生成描述性的体积表示,并连接 RPN 以生成检测。
Nov, 2017
本研究提出了一种基于 LIDAR 传感器的一阶段 3D 目标检测器,该检测器在从点数据中提取特征上表现出更好的性能,并在 KITTI-3D 基准测试中表现优异,其速度和准确性在实际场景中具有实际应用价值。
Jun, 2019
本文提出了一种基于体素的框架 ——Voxel R-CNN,通过从体素特征中提取 RoI 特征,实现与最先进的基于点的模型相当的检测准确度,但计算成本只有一小部分,并在 KITTI 数据集上实现了更高的检测准确度和实时图像处理速率。
Dec, 2020
提出了一种名为 Pix2Vox ++ 的新框架,用于从单视角或多视角图像恢复 3D 物体,使用编码器 - 解码器生成初始 3D 体积,并引入了多尺度上下文感知融合模块自适应地选择高质量的重建部分,以获得融合的 3D 体积,并进一步采用提炼器来选择性地探测出融合的 3D 体积中错误恢复的部分,最终得出鲁棒性和有效性均优于现有方法的结果。
Jun, 2020
该论文的研究结果表明在深度学习和编码器 - 解码器架构的帮助下,使用光线追踪跳跃连接和混合的 3D 模型表示技术可以从单个图像中重构出 3D 物体模型,并且同样的技术可以从单张图像中重构出多个 3D 物体模型,并处理遮挡问题。
Apr, 2020
提出了一种名为 PointVoxel-RCNN(PV-RCNN)的 3D 物体检测框架,可以使用点云实现准确的物体检测,使用了 3D voxel 卷积神经网络和基于 PointNet 的集合抽象相结合的方法深度学习了更具有区分性的点云特征,并使用 RoI-grid 池化方法编码具有可比性的特征从而实现了更准确的 3D 检测效果。
Dec, 2019