LidarMultiNet: 一个将激光雷达语义分割、3D 目标检测和全景分割统一于单个多任务网络中的方法
本文介绍了一种基于 LiDAR 的多任务网络 LidarMultiNet,它将 LiDAR 的三个主要感知任务:3D 物体检测,语义分割和全景分割统一起来。通过使用全局上下文汇聚(GCP)模块提取全局上下文特征,任务特定的头被添加到网络的顶部执行三种任务。LidarMultiNet 在 Waymo Open Dataset 和 nuScenes 数据集 上进行了广泛的测试,表明主要 LiDAR 感知任务可以在单个强网络中统一,并在既有 API 上取得最佳结果。
Sep, 2022
本文提出了一种基于 LiDAR 传感器和多任务网络的感知系统,用于自主驾驶中的目标检测和道路识别,取得了良好的实验效果和在线定位能力。
Mar, 2021
本文介绍了一种使用多视角 LiDAR 点云的双阶段深度神经网络,用于多类目标检测和行驶空间分割,通过两个阶段的处理,能够在挑战性的场景中使用单个 LiDAR 扫描作为输入同时检测和分类物体,同时确定驾驶空间,该系统在配备于自动驾驶汽车的嵌入式 GPU 上能够高效运行,并展示了在 KITTI 数据集和更大型的内部数据集上的测试结果。
Jun, 2020
CPGNet-LCF 是一个新的多模态融合框架,通过继承 CPGNet 的易于部署和实时能力来解决合并 LiDAR 和相机之间弱校准的挑战,在训练过程中引入一种新颖的弱校准知识蒸馏策略以提高其对弱校准的鲁棒性,实现了在 nuScenes 和 SemanticKITTI 基准测试上的最先进性能,并且可在单个 Tesla V100 GPU 上以 20ms 每帧的速度运行,进一步展示了我们提出的方法的鲁棒性。
Oct, 2023
本研究提出了一种利用分割信息指导检测过程的多任务框架,该框架联合执行三维物体检测和全景分割,可利用多视角信息解决每个投影视图的缺陷,并通过前景语义信息和中心密度热力图来提示物体的可能框中心位置。在 nuScenes 数据集上进行的大量实验表明,该方法提供了显著的性能提升,基于单级 CenterPoint 3D 物体检测网络的所提出方法在 nuScenes 3D 检测基准上取得了 67.3 NDS 的最新性能。
Mar, 2022
利用多模态数据的几何和语义特征,通过三个步骤来完成多模态 3D 语义分割任务。经过我们的研究,MSeg3D 在 nuScenes、Waymo 和 SemanticKITTI 数据集上取得了最先进的结果。
Mar, 2023
LiDAR 在自动驾驶中具有重要作用,本文提出了一种基于 LiDAR 的实时多任务卷积神经网络,用于对象检测、语义分割和运动分割,并在汽车级嵌入式平台上实现了 3ms 延迟,取得了语义分割和运动分割的最新成果以及 3D 物体检测的接近最新成果。
Jul, 2023
该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks(MV3D)框架,该框架采用多传感器融合技术,将 LIDAR 点云和 RGB 图像作为输入,并预测有方向的 3D 界限框。实验表明,该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25%和 30%,在 2D 检测中也表现出显著的技术优势。
Nov, 2016
本文提出了一种名为 LoGoNet 的基于 LiDAR 和相机融合的新型神经网络,该网络能够同时在局部和全局层面上对 3D 物体进行检测,并在 Waymo 和 KITTI 数据集上获得了最佳检测表现。
Mar, 2023