从体素到点云：基于 IoU 引导的用于点云的三维物体检测的体素到点云解码器

MMAug, 2021

从体素到点云：基于 IoU 引导的用于点云的三维物体检测的体素到点云解码器

From Voxel to Point: IoU-guided 3D Object Detection for Point Cloud with Voxel-to-Point Decoder

Jiale Li, Hang Dai, Ling Shao, Yong Ding

TL;DR本研究提出了一种 IoU 引导的两阶段 3D 物体检测器，并结合采用 “残差体素到点云” 和 “ROI 对齐” 来提高检测精度，实验表明该方法在 KITTI 数据集上具有明显优势。

Abstract

In this paper, we present an intersection-over-union (IoU) guided two-stage 3d object detector with a voxel-to-point decoder. To preserve the necessary information from all raw points and maintain the high box re

3d object detector intersection-over-union rpn roi alignment kitti

发现论文，激发创造

3D IoU-Net: 基于 IoU 的点云三维物体检测器

提出了一种在 3D 物体检测中通过 IoU 预测来解决 NMS 中准确性问题的方法，使用了 3D IoU-Net 进行特征学习和准确性预测，并通过 Corner Geometry Encoding 和 Attentive Corner Aggregation 模块提取几何信息并实现对预测角度的不变性，实验结果表明，该方法在 KITTI car detection benchmark 上达到了最先进水平。

Apr, 2020

Voxel R-CNN：面向高性能体素化三维目标检测

本文提出了一种基于体素的框架 ——Voxel R-CNN，通过从体素特征中提取 RoI 特征，实现与最先进的基于点的模型相当的检测准确度，但计算成本只有一小部分，并在 KITTI 数据集上实现了更高的检测准确度和实时图像处理速率。

Dec, 2020

Voxel-FPN：在点云中多尺度体素特征聚合的三维物体检测

本研究提出了一种基于 LIDAR 传感器的一阶段 3D 目标检测器，该检测器在从点数据中提取特征上表现出更好的性能，并在 KITTI-3D 基准测试中表现优异，其速度和准确性在实际场景中具有实际应用价值。

Jun, 2019

PV-RCNN: 用于 3D 物体检测的点 - 体素特征集抽象

提出了一种名为 PointVoxel-RCNN（PV-RCNN）的 3D 物体检测框架，可以使用点云实现准确的物体检测，使用了 3D voxel 卷积神经网络和基于 PointNet 的集合抽象相结合的方法深度学习了更具有区分性的点云特征，并使用 RoI-grid 池化方法编码具有可比性的特征从而实现了更准确的 3D 检测效果。

Dec, 2019

VoxelNet：基于点云的三维物体检测的端到端学习

VoxelNet 是一种针对点云图像检测的深度网络，可以将点云分割成等间距的三维体素，并通过新引入的体素特征编码层将每组点转换为统一的特征表示，从而生成描述性的体积表示，并连接 RPN 以生成检测。

Nov, 2017

PV-RCNN++：具有局部向量表示的点 - 体素特征集抽象用于 3D 目标检测

本文提出了一种针对点云的三维目标检测新方法 PV-RCNN，通过点和体素两个方面来深度整合特征学习，采用体素到关键点场景编码和关键点到网格 RoI 特征抽象两个创新步骤，更高效准确地实现三维目标检测。PV-RCNN++ 框架通过部分区域划分建议 - 中心采样和 VectorPool 池化等两种策略，在更低资源消耗下实现了更优秀的性能，相比 PV-RCNN 在保持准确率的同时提高了 3 倍速度，并在大规模 Waymo 开放数据集上取得了最先进的三维检测性能。

Jan, 2021

OCM3D：基于物体的单目三维物体检测

本文提出了一种适用于单目三维目标检测的新型基于物体的体素表示法，能够有效地组织噪点云在体素网格内，并能够精确定位对象在三维空间中的位置。通过考虑三维物体与相关二维框之间的关系，我们将单目三维目标检测中的置信度机制进行了分解，并在 KITTI 数据集上进行了评估，性能显著优于现有技术。

Apr, 2021

快速点云 R-CNN

本篇研究提出了一种基于点云的三维物体检测框架，采用两个阶段的方法，利用体素表示和点云原始数据的优势进行特征提取，并在 KITTI 数据集上进行评估，取得了 3D 和 Bird's Eye View（BEV）检测的最新成果，检测速度达到了每秒 15 帧。

Aug, 2019

基于语义装饰局部图的精确三维目标检测的 Graph R-CNN

本文提出了一种名为 Graph R-CNN 的二阶段三维目标检测器，它使用动态点聚合、RoI-graph 池化和视觉特征增强等方法，解决了现有二阶段三维目标检测器处理不均匀分布和稀疏室外点时的效率问题，并在 KITTI 和 Waymo Open Dataset 上大幅优于现有模型。

Aug, 2022

HVPR: 单级 3D 物体检测的混合体素 - 点表示

本文提出了一种新的单级三维检测方法 HVPR，它将点云的体素特征与点特征有效且高效地集成到一个伪图像的混合三维表示中，从而实现了三维对象的定位。同时，我们提出了一种 Attentive Multi-scale Feature Module（AMFM），用于考虑点云的稀疏和不规则分布，以提取具有尺度感知的特征，并在 KITTI 数据集上验证了我们方法的有效性和效率。

Apr, 2021