LidarMultiNet: 一个将激光雷达语义分割、3D 目标检测和全景分割统一于单个多任务网络中的方法

CVPRJun, 2022

LidarMultiNet: 一个将激光雷达语义分割、3D 目标检测和全景分割统一于单个多任务网络中的方法

LidarMultiNet: Unifying LiDAR Semantic Segmentation, 3D Object Detection, and Panoptic Segmentation in a Single Multi-task Network

PDF

Dongqiangzi Ye, Weijia Chen, Zixiang Zhou, Yufei Xie, Yu Wang...

TL;DRLidarMultiNet 利用深度神经网络，将 3D 语义分割、物体检测和全景分割等核心 LiDAR 感知任务统一在单一框架中，实现了最佳表现。

Abstract

This technical report presents the 1st place winning solution for the Waymo Open Dataset 3d semantic segmentation challenge 2022. Our network, termed lidarmultinet, unifies the major →

lidarmultinet 3d semantic segmentation object detection panoptic segmentation lidar perception

发现论文，激发创造

LidarMultiNet: 面向 LiDAR 感知的统一多任务网络

本文介绍了一种基于 LiDAR 的多任务网络 LidarMultiNet，它将 LiDAR 的三个主要感知任务：3D 物体检测，语义分割和全景分割统一起来。通过使用全局上下文汇聚（GCP）模块提取全局上下文特征，任务特定的头被添加到网络的顶部执行三种任务。LidarMultiNet 在 Waymo Open Dataset 和 nuScenes 数据集上进行了广泛的测试，表明主要 LiDAR 感知任务可以在单个强网络中统一，并在既有 API 上取得最佳结果。

Sep, 2022

多空间对齐的通用激光雷达分割

提出了一种统一且多功能的 LiDAR 分割模型 M3Net，通过仅使用一组参数，能够对各种类型的数据进行训练，并在自动驾驶感知中取得了显著的效果。

May, 2024

一种简单高效的用于 3D 目标检测和道路理解的多任务网络

本文提出了一种基于 LiDAR 传感器和多任务网络的感知系统，用于自主驾驶中的目标检测和道路识别，取得了良好的实验效果和在线定位能力。

Mar, 2021

MVLidarNet: 使用多视角实现自动驾驶的实时多类场景理解

本文介绍了一种使用多视角 LiDAR 点云的双阶段深度神经网络，用于多类目标检测和行驶空间分割，通过两个阶段的处理，能够在挑战性的场景中使用单个 LiDAR 扫描作为输入同时检测和分类物体，同时确定驾驶空间，该系统在配备于自动驾驶汽车的嵌入式 GPU 上能够高效运行，并展示了在 KITTI 数据集和更大型的内部数据集上的测试结果。

Jun, 2020

重新审视现实世界自主驾驶的多模态三维语义分割

CPGNet-LCF 是一个新的多模态融合框架，通过继承 CPGNet 的易于部署和实时能力来解决合并 LiDAR 和相机之间弱校准的挑战，在训练过程中引入一种新颖的弱校准知识蒸馏策略以提高其对弱校准的鲁棒性，实现了在 nuScenes 和 SemanticKITTI 基准测试上的最先进性能，并且可在单个 Tesla V100 GPU 上以 20ms 每帧的速度运行，进一步展示了我们提出的方法的鲁棒性。

Oct, 2023

基于全景分割引导的 LiDAR 多视角三维物体检测通用框架

本研究提出了一种利用分割信息指导检测过程的多任务框架，该框架联合执行三维物体检测和全景分割，可利用多视角信息解决每个投影视图的缺陷，并通过前景语义信息和中心密度热力图来提示物体的可能框中心位置。在 nuScenes 数据集上进行的大量实验表明，该方法提供了显著的性能提升，基于单级 CenterPoint 3D 物体检测网络的所提出方法在 nuScenes 3D 检测基准上取得了 67.3 NDS 的最新性能。

Mar, 2022

自动驾驶多模态三维语义分割 MSeg3D

利用多模态数据的几何和语义特征，通过三个步骤来完成多模态 3D 语义分割任务。经过我们的研究，MSeg3D 在 nuScenes、Waymo 和 SemanticKITTI 数据集上取得了最先进的结果。

Mar, 2023

LiDAR-BEVMTN：用于自动驾驶的实时激光雷达鸟瞰式多任务感知网络

LiDAR 在自动驾驶中具有重要作用，本文提出了一种基于 LiDAR 的实时多任务卷积神经网络，用于对象检测、语义分割和运动分割，并在汽车级嵌入式平台上实现了 3ms 延迟，取得了语义分割和运动分割的最新成果以及 3D 物体检测的接近最新成果。

Jul, 2023

用于自动驾驶的多视角三维物体检测网络

该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks（MV3D）框架，该框架采用多传感器融合技术，将 LIDAR 点云和 RGB 图像作为输入，并预测有方向的 3D 界限框。实验表明，该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25％和 30％，在 2D 检测中也表现出显著的技术优势。

Nov, 2016

LoGoNet: 基于局部到全局跨模态融合的精确三维物体检测

本文提出了一种名为 LoGoNet 的基于 LiDAR 和相机融合的新型神经网络，该网络能够同时在局部和全局层面上对 3D 物体进行检测，并在 Waymo 和 KITTI 数据集上获得了最佳检测表现。

Mar, 2023