基于 MinkUNet 的人体三维激光雷达点云检测

CVPRJul, 2021

基于 MinkUNet 的人体三维激光雷达点云检测

Person-MinkUNet: 3D Person Detection with LiDAR Point Cloud

Dan Jia, Bastian Leibe

TL;DR本研究利用次流形稀疏卷积，探索应用于三维人体检测任务。我们提出了基于 Minkowski 引擎和 U-Net 架构的单级三维人体检测网络 Person-MinkUNet，并在 JRDB 三维检测基准测试中实现了 76.4％的平均精度（AP）

Abstract

In this preliminary work we attempt to apply submanifold sparse convolution to the task of 3d person detection. In particular, we present person-

submanifold sparse convolution 3d person detection person-minkunet minkowski engine jrdb 3d detection benchmark

发现论文，激发创造

MinkUNeXt：基于稀疏三维卷积的基于点云的大规模地点识别

MinkUNeXt 是一种基于 3D MinkNeXt Block 的高效有效的基于点云的地点识别架构，该架构通过 3D 稀疏卷积实现特征提取和聚合，并在测试中表现出优于其他方法的结果。

Mar, 2024

MinkLoc3D：基于点云的大规模场所识别

提出了一种名为 MinkLoc3D 的基于学习的方法，用于计算具有区分性的三维点云描述符，该方法使用稀疏体素化的点云表示和稀疏三维卷积，相比目前最先进的方法具有更好的性能。

Nov, 2020

StarNet：针对点云目标检测的定向计算

本文提出了一个名为 StarNet 的基于点云的物体检测系统，利用了点云数据稀疏和三维特征的优点，采用采样策略和数据依赖的 anchors，相比传统卷积方法能够更加灵活和高效地检测道路上行人和其他物体。同时，该系统还可以通过利用时间序列信息和利用先验信息和启发式算法精准地定位需要检测的区域。实验表明，StarNet 相比于传统卷积基线具有更好的检测表现，并且可以在不重新训练的情况下根据需求灵活控制计算成本。

Aug, 2019

VoxelNet：基于点云的三维物体检测的端到端学习

VoxelNet 是一种针对点云图像检测的深度网络，可以将点云分割成等间距的三维体素，并通过新引入的体素特征编码层将每组点转换为统一的特征表示，从而生成描述性的体积表示，并连接 RPN 以生成检测。

Nov, 2017

LiDAR-HMR: LiDAR 中的 3D 人体网格恢复

本文首次尝试从稀疏的 LiDAR 点云中估计 3D 人体网格，提出了一种有效的稀疏到稠密重建方案，并通过引入图形变换器来更好地利用点云的 3D 结构信息，实验证明了该方法的有效性。

Nov, 2023

基于点云的三维全卷积网络车辆检测

本文将全卷积网络技术扩展到三维，并将其应用于点云数据的车辆检测任务中，实验结果表明该方法在自动驾驶领域的 KITTI 数据集上表现较之前的点云检测方法有显著提升。

Nov, 2016

用于自动驾驶的多视角三维物体检测网络

该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks（MV3D）框架，该框架采用多传感器融合技术，将 LIDAR 点云和 RGB 图像作为输入，并预测有方向的 3D 界限框。实验表明，该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25％和 30％，在 2D 检测中也表现出显著的技术优势。

Nov, 2016

LiDAR R-CNN：一种高效且通用的三维物体检测器

本文研究基于激光雷达点云的三维检测在自动驾驶的感知系统中的重要性，并提出了 LiDAR R-CNN，这是一种可改进任何现有三维检测器的第二阶段检测器，采用了基于点的方法解决了实时和高精度要求的问题，在实际中具有普适性和优越性能。

Mar, 2021

基于 LSTM 的 LiDAR 点云时序三维物体检测方法

本文提出了一种基于稀疏 LSTM 的多帧 3D 对象检测算法，使用 U-Net 风格的稀疏 3D 卷积网络提取每帧 LiDAR 点云的特征，并将这些特征与上一帧的隐藏和记忆特征一起输入到 LSTM 模块中，以预测当前帧中的 3D 对象，同时传递给下一帧的隐藏和记忆特征。实验结果表明，我们的算法在使用更少的内存和每帧计算的情况下优于传统的逐帧方法 7.5％ [email protected] 和其他多帧方法 1.2％。据我们所知，这是在稀疏点云中首次使用 LSTM 进行 3D 对象检测的工作。

Jul, 2020

KPRNet: 基于投影的激光雷达语义分割的改进

本研究采用最新的图像和点云分割技术，在卷积神经网络体系结构和 point-wise 组件中应用 KPConv，从而在对 LiDAR 扫描进行分割的任务中实现更好的准确性。已经在 SemanticKITTI 基准测试中超过了当前最佳方法，达到了 63.1 的 mIoU。

Jul, 2020