基于体素的单图像多物体三维检测和重建

Nov, 2021

基于体素的单图像多物体三维检测和重建

Voxel-based 3D Detection and Reconstruction of Multiple Objects from a Single Image

PDF

Feng Liu, Xiaoming Liu

TL;DR该研究提出了一种基于 3D 体素特征的中心点检测方法，其中包括一个有效的粗细重建模块，可从单个 2D 图像中检测和重建多个物体的 3D 位置和形状。

Abstract

Inferring 3d locations and shapes of multiple objects from a single 2d image is a long-standing objective of →

3d locations 2d image computer vision centernet-3d detection multiple objects

发现论文，激发创造

从点云到多目标三维重建

本文提出了一种从单一 RGB 图像中检测和重构多个 3D 物体的方法，通过逐步优化检测、对齐和形状重构，选择最佳的几个候选形状，并采用轻量化的重构技术进行快速、端到端的训练。

Dec, 2020

多层次三维卷积神经网络学习多尺度空间特征

本文提出了一种基于多层体素网格的端到端多级学习方法来解决现有 3D 目标识别中结构化和非结构化数据表示的缺陷，结果表明该方法在节约内存的同时能够实现与密集体素表示相当的目标识别性能。

May, 2018

VR3Dense: 用于三维物体检测和单目密集深度重建的体素表示学习

介绍了一种联合训练 3D 目标检测和单目稠密深度重建神经网络的方法，通过 LiDAR 点云和单个 RGB 图像生成物体姿态预测和密集重建深度，其中 LiDAR 点云被转换为一组体素并使用 3D 卷积层提取特征，通过另一个 2D 卷积神经网络提取相应的 RGB 图像特征，并使用这些组合特征来预测密集深度图。

Apr, 2021

OCM3D：基于物体的单目三维物体检测

本文提出了一种适用于单目三维目标检测的新型基于物体的体素表示法，能够有效地组织噪点云在体素网格内，并能够精确定位对象在三维空间中的位置。通过考虑三维物体与相关二维框之间的关系，我们将单目三维目标检测中的置信度机制进行了分解，并在 KITTI 数据集上进行了评估，性能显著优于现有技术。

Apr, 2021

VoxelNet：基于点云的三维物体检测的端到端学习

VoxelNet 是一种针对点云图像检测的深度网络，可以将点云分割成等间距的三维体素，并通过新引入的体素特征编码层将每组点转换为统一的特征表示，从而生成描述性的体积表示，并连接 RPN 以生成检测。

Nov, 2017

Voxel-FPN：在点云中多尺度体素特征聚合的三维物体检测

本研究提出了一种基于 LIDAR 传感器的一阶段 3D 目标检测器，该检测器在从点数据中提取特征上表现出更好的性能，并在 KITTI-3D 基准测试中表现优异，其速度和准确性在实际场景中具有实际应用价值。

Jun, 2019

Voxel R-CNN：面向高性能体素化三维目标检测

本文提出了一种基于体素的框架 ——Voxel R-CNN，通过从体素特征中提取 RoI 特征，实现与最先进的基于点的模型相当的检测准确度，但计算成本只有一小部分，并在 KITTI 数据集上实现了更高的检测准确度和实时图像处理速率。

Dec, 2020

Pix2Vox++：基于多尺度上下文感知的单张和多张图像的三维物体重建

提出了一种名为 Pix2Vox ++ 的新框架，用于从单视角或多视角图像恢复 3D 物体，使用编码器 - 解码器生成初始 3D 体积，并引入了多尺度上下文感知融合模块自适应地选择高质量的重建部分，以获得融合的 3D 体积，并进一步采用提炼器来选择性地探测出融合的 3D 体积中错误恢复的部分，最终得出鲁棒性和有效性均优于现有方法的结果。

Jun, 2020

CoReNet：从单个 RGB 图像中重构连贯的 3D 场景

该论文的研究结果表明在深度学习和编码器 - 解码器架构的帮助下，使用光线追踪跳跃连接和混合的 3D 模型表示技术可以从单个图像中重构出 3D 物体模型，并且同样的技术可以从单张图像中重构出多个 3D 物体模型，并处理遮挡问题。

Apr, 2020

PV-RCNN: 用于 3D 物体检测的点 - 体素特征集抽象

提出了一种名为 PointVoxel-RCNN（PV-RCNN）的 3D 物体检测框架，可以使用点云实现准确的物体检测，使用了 3D voxel 卷积神经网络和基于 PointNet 的集合抽象相结合的方法深度学习了更具有区分性的点云特征，并使用 RoI-grid 池化方法编码具有可比性的特征从而实现了更准确的 3D 检测效果。

Dec, 2019