一种简单高效的用于 3D 目标检测和道路理解的多任务网络

Mar, 2021

一种简单高效的用于 3D 目标检测和道路理解的多任务网络

A Simple and Efficient Multi-task Network for 3D Object Detection and Road Understanding

Di Feng, Yiyang Zhou, Chenfeng Xu, Masayoshi Tomizuka, Wei Zhan

TL;DR本文提出了一种基于 LiDAR 传感器和多任务网络的感知系统，用于自主驾驶中的目标检测和道路识别，取得了良好的实验效果和在线定位能力。

Abstract

Detecting dynamic objects and predicting static road information such as drivable areas and ground heights are crucial for safe autonomous driving. Previous works studied each perception task separately, and lacked a collective quantitative analysis. In this work, we show that it is po

autonomous driving perception tasks lidar multi-task network object detection

发现论文，激发创造

LidarMultiNet: 面向 LiDAR 感知的统一多任务网络

本文介绍了一种基于 LiDAR 的多任务网络 LidarMultiNet，它将 LiDAR 的三个主要感知任务：3D 物体检测，语义分割和全景分割统一起来。通过使用全局上下文汇聚（GCP）模块提取全局上下文特征，任务特定的头被添加到网络的顶部执行三种任务。LidarMultiNet 在 Waymo Open Dataset 和 nuScenes 数据集上进行了广泛的测试，表明主要 LiDAR 感知任务可以在单个强网络中统一，并在既有 API 上取得最佳结果。

Sep, 2022

LiDAR-BEVMTN：用于自动驾驶的实时激光雷达鸟瞰式多任务感知网络

LiDAR 在自动驾驶中具有重要作用，本文提出了一种基于 LiDAR 的实时多任务卷积神经网络，用于对象检测、语义分割和运动分割，并在汽车级嵌入式平台上实现了 3ms 延迟，取得了语义分割和运动分割的最新成果以及 3D 物体检测的接近最新成果。

Jul, 2023

用于自动驾驶的多视角三维物体检测网络

该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks（MV3D）框架，该框架采用多传感器融合技术，将 LIDAR 点云和 RGB 图像作为输入，并预测有方向的 3D 界限框。实验表明，该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25％和 30％，在 2D 检测中也表现出显著的技术优势。

Nov, 2016

LidarMultiNet: 一个将激光雷达语义分割、3D 目标检测和全景分割统一于单个多任务网络中的方法

LidarMultiNet 利用深度神经网络，将 3D 语义分割、物体检测和全景分割等核心 LiDAR 感知任务统一在单一框架中，实现了最佳表现。

Jun, 2022

MVLidarNet: 使用多视角实现自动驾驶的实时多类场景理解

本文介绍了一种使用多视角 LiDAR 点云的双阶段深度神经网络，用于多类目标检测和行驶空间分割，通过两个阶段的处理，能够在挑战性的场景中使用单个 LiDAR 扫描作为输入同时检测和分类物体，同时确定驾驶空间，该系统在配备于自动驾驶汽车的嵌入式 GPU 上能够高效运行，并展示了在 KITTI 数据集和更大型的内部数据集上的测试结果。

Jun, 2020

实时通用多任务的一次全部观察

自主驾驶的关键要求是高精度、轻量化和实时响应，本文提出了一种自适应、实时和轻量化的多任务模型，能够同时处理目标检测、行驶区域分割和车道检测任务，并且无需特定定制结构或损失函数。该模型在 BDD100k 数据集上取得了竞争性的结果，尤其在可视化输出方面。此外，通过引入真实道路数据集评估了模型在真实场景中的性能，表现出超出竞争对手的优越性能，证明了模型不仅具备竞争性能，而且更加灵活快速。

Oct, 2023

InfraDet3D：基于路侧基础设施摄像机和激光雷达传感器的多模态三维物体检测

本文介绍了一种新的基础设施传感器的多模 3D 物体检测器 InfraDet3D，有效结合了两个 LiDAR 和单目相机数据，通过早期融合方法提高检测效果，并将 HD 地图应用于单目 3D 检测模块，以提升其最终的感知结果；该系统在德国慕尼黑的 A9 测试区域进行了实际部署和评估，得到了 68.48 的 mAP 测试结果，同时数据集和代码也提供给研究社区进行进一步的研究。

Apr, 2023

利用任务适应性注意力生成器的实时自主驾驶多任务学习

本文介绍了一种新的实时多任务网络，包括单目三维物体检测、语义分割和密集深度估计，通过引入任务自适应注意力生成器来解决多任务学习中普遍存在的负迁移问题，并利用硬参数共享方法提高效率，能够同时处理多个任务，尤其是三维物体检测，并保持实时处理速度。经过在 Cityscapes-3D 数据集上的严格优化和深入剖析研究，我们的网络始终优于各种基准模型。

Mar, 2024

多模态多任务 (3MT) 道路分割

该研究提出了一种成本效益高且精确的道路分割解决方案，通过在多任务学习架构中整合来自多个传感器的数据，利用多模态系统比单模态系统能够产生更可靠的结果，使用原始传感器输入而非高预处理成本的架构，同时将 RGB 和 LiDAR 深度图像作为网络的输入，与 IMU/GNSS 惯性导航系统数据进行聚合，实验证明该方法在 KITTI 数据集和 Cityscapes 数据集上都取得了快速且高性能的解决方案，可以与不同的传感器模态一起使用，推理时间非常适合实时实验。

Aug, 2023

多任务多传感器融合的三维物体检测

本文提出了一种利用多个相关任务进行准确多传感器 3D 目标检测的方法，并展示了一种全面的可学习体系结构，用于推理 2D 和 3D 目标检测以及地面估计和深度完成，在各个层面上融合信息有助于学习更好的表示。实验表明，所有这些任务是互补的，可以在保持实时性的同时，在 2D、3D 和 BEV 目标检测方面领先 KITTI 基准。

Dec, 2020