VPFNet：基于体素像素融合的多类三维物体检测网络

Nov, 2021

VPFNet：基于体素像素融合的多类三维物体检测网络

VPFNet: Voxel-Pixel Fusion Network for Multi-class 3D Object Detection

Chia-Hung Wang, Hsueh-Wei Chen, Li-Chen Fu

TL;DR本论文提出了一种基于深度学习的融合多类三维物体检测网络，使用 Voxel-Pixel 融合层将激光雷达和相机传感器数据流进行联合，此方法在 KITTI 基准测试中表现优异，排名第一。

Abstract

Many lidar-based methods for detecting large objects, single-class object detection, or under easy situations were claimed to perform quite well. However, their performances of detecting small objects or under hard situations did not surpass those of the →

lidar 3d object detection fusion deep learning kitti benchmark

发现论文，激发创造

VPFNet: 采用虚拟基于点的 LiDAR 和立体数据融合来提高三维物体检测

VPFNet 是一种新的网络架构，通过虚拟点 cleverly aligns and aggregates the point cloud and image data 来解决 3D 点云和图像数据之间的不匹配问题，同时利用数据增强技术来提高 3D 目标检测的性能。在 KITTI 数据集上的实验中，在保证计算效率的情况下，VPFNet 取得了很好的性能表现。

Nov, 2021

用于 3D 目标检测的密集体素融合

提出了基于 Dense Voxel Fusion 的序列融合方法，该方法对于自主车辆应用中的 3D 物体检测具有重要意义。通过直接使用地面真实 3D 边界框标签进行训练，避免使用嘈杂的、特定于检测器的 2D 预测。DVF 在 KITTI 3D 汽车检测基准测试中排名第三，且不引入额外的可训练参数，也不需要使用立体图像或密集深度标签。此外，在 Waymo 开放数据集上，DVF 显著提高了基于体素的方法在 3D 车辆检测方面的性能。

Mar, 2022

VoxelNet：基于点云的三维物体检测的端到端学习

VoxelNet 是一种针对点云图像检测的深度网络，可以将点云分割成等间距的三维体素，并通过新引入的体素特征编码层将每组点转换为统一的特征表示，从而生成描述性的体积表示，并连接 RPN 以生成检测。

Nov, 2017

VPFusion：面向三维物体检测的稳健垂直表示学习

本文提出了一种名为 VPFusion 的垂直多尺度表示学习框架，它将来自体素和柱状流的互补信息相结合，有效提高了点云表示的精度，实验结果表明 VPFusion 超越了基线，实现了实时推理速度。

Apr, 2023

HVNet：用于基于激光雷达的三维物体检测的混合体素网络

我们提出了一种名叫 Hybrid Voxel Network（HVNet）的新型一阶段统一网络，用于基于点云的自动驾驶 3D 目标检测。在 KITTI 基准测试中，单个 HVNet 实现了最好的 mAP，并具有 31Hz 的实时推理速度。

Feb, 2020

Voxel-FPN：在点云中多尺度体素特征聚合的三维物体检测

本研究提出了一种基于 LIDAR 传感器的一阶段 3D 目标检测器，该检测器在从点数据中提取特征上表现出更好的性能，并在 KITTI-3D 基准测试中表现优异，其速度和准确性在实际场景中具有实际应用价值。

Jun, 2019

VoxelNextFusion：一个简单、统一且有效的多模态三维物体检测体素融合框架

VoxelNextFusion 是一种多模态的三维物体检测框架，通过有效地融合稀疏点云和密集图像之间的信息，解决了现有基于体素方法在稀疏和密集特征融合上的问题，从而在 KITTI 和 nuScenes 数据集上实现了 3D 物体检测的显著改进。

Jan, 2024

MVX-Net: 基于多模态 VoxcelNet 的三维物体检测

该研究提出了两种简单而有效的融合 RGB 和点云模态的早期融合方法，称为 PointFusion 和 VoxelFusion，并利用 VoxelNet 结构来结合这些模态，从而实现与最先进的多模态算法竞争力相当的表现，其能够在 KITTI 基准测试的五个车顶俯视图和 3D 检测类别中实现前两名的排名。

Apr, 2019

重新思考三维物体检测的体素化和分类

该论文提出了一种解决方案，通过实现快速动态体素化器，以便在快速基于柱体模型中像体素化器在缓慢的基于体素模型中工作一样工作，实现网络推理速度和精度的提高。此外，作者还提出了轻型检测子头模型来分类预测的物体，并过滤出虚假的检测物体，从而显著提高模型的精度，在可忽略的时间和计算成本内。

Jan, 2023

多视图自适应融合网络用于三维物体检测

本文提出了一种基于多视角融合的 3D 目标检测网络，结合了激光雷达鸟瞰视角、激光雷达距离视角和相机视角图像，使用注意力机制和额外任务优化点特征和结构信息，有效地实现了多视角特征的适应性融合，该网络在 KITTI 3D 目标检测数据集上的表现令人满意。

Nov, 2020