3D 语义分割驱动的三维物体检测表征

Mar, 2024

3D 语义分割驱动的三维物体检测表征

3D Semantic Segmentation-Driven Representations for 3D Object Detection

Hayeon O, Kunsoo Huh

TL;DR在自动驾驶中，相较于 2D 检测，3D 检测能够提供更精确的信息用于路径规划和运动估计。然而，由于缺乏几何信息，单一和多视角图像以及来自相机的深度图在检测精度上相对较低。本文提出了 SeSame：一种基于点的语义特征的新表达方法，以确保基于 LiDAR 的 3D 检测具有充足的语义信息。实验证明，我们的方法在 KITTI 物体检测基准测试中在不同难度级别和车辆上优于以前的最先进方法。

Abstract

In autonomous driving, 3d detection provides more precise information to downstream tasks, including path planning and motion estimation, compared to 2D detection. Therefore, the need for →

autonomous driving 3d detection multi-modal geometric features point-wise semantic feature

发现论文，激发创造

MS23D：一种使用多尺度语义特征点构建 3D 特征层的三维目标检测方法

MS$^{2}$3D 是一个两阶段的三维检测框架，利用小尺寸的体素提取细粒度的局部特征和大尺寸的体素捕捉长程局部特征，通过多尺度语义特征点构建三维特征层并计算特征点与目标质心的偏移，以提高特征聚合的效率，在 KITTI 数据集和 ONCE 数据集上验证了该方法的有效性。

Aug, 2023

自动驾驶多模态三维语义分割 MSeg3D

利用多模态数据的几何和语义特征，通过三个步骤来完成多模态 3D 语义分割任务。经过我们的研究，MSeg3D 在 nuScenes、Waymo 和 SemanticKITTI 数据集上取得了最先进的结果。

Mar, 2023

用于自动驾驶的多视角三维物体检测网络

该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks（MV3D）框架，该框架采用多传感器融合技术，将 LIDAR 点云和 RGB 图像作为输入，并预测有方向的 3D 界限框。实验表明，该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25％和 30％，在 2D 检测中也表现出显著的技术优势。

Nov, 2016

3M3D: 多视角、多路径、多表征 3D 目标检测

提出了一种基于多视图轴自注意力和局部 ROI 自注意力的多路径多表示 3D 物体检测方法，通过稀疏浮动查询和密集 BEV 查询的多重表示进一步提高了性能，对于自动驾驶系统具有重要意义。

Feb, 2023

自动驾驶的 3D 物体检测综述

本文旨在填补 3D 对象检测在自动驾驶中的知识空白，综述了相关领域的传感器、数据集、性能度量以及最新的检测方法，分析了其优劣，并进行了定量比较和案例研究，最后总结了研究成果和未来发展方向。

Jun, 2021

视角到标签：自监督三维物体检测的多视角一致性

提出了一种基于多视角和弱标签的纯 RGB 序列的自监督 3D 物体检测方法，其在 KITTI 3D 数据集上的性能与使用激光雷达或立体图像的最先进的自监督方法相当。

May, 2023

基于全景分割引导的 LiDAR 多视角三维物体检测通用框架

本研究提出了一种利用分割信息指导检测过程的多任务框架，该框架联合执行三维物体检测和全景分割，可利用多视角信息解决每个投影视图的缺陷，并通过前景语义信息和中心密度热力图来提示物体的可能框中心位置。在 nuScenes 数据集上进行的大量实验表明，该方法提供了显著的性能提升，基于单级 CenterPoint 3D 物体检测网络的所提出方法在 nuScenes 3D 检测基准上取得了 67.3 NDS 的最新性能。

Mar, 2022

多模态虚拟点 3D 检测

通过无缝融合 RGB 传感器到 Lidar 的 3D 识别中，我们提出了一个简单而有效的多模态检测器，该方法利用一组 2D 检测生成密集的虚拟 3D 点，能够增强原来稀疏的 3D 点云，实验结果在大规模 nuScenes 数据集上取得了显着的改进，并超过了竞争融合方法。

Nov, 2021

Complexer-YOLO：基于语义点云的实时 3D 目标检测和跟踪

本文提出了一种融合神经网络、视觉语义分割、在自主驾驶场景下的 3D 目标检测方法，引入了一种名为 SRTs 的快速评估指标，并采用状态优化的多目标特征跟踪机制，实现了高精度和实时性的平衡，并在 KITTI 基准测试中验证了方法的有效性。同时，该方法首次将视觉语义与 3D 目标检测相融合。

Apr, 2019

GS3D：面向自动驾驶的高效三维物体检测框架

本文提出了一种基于单个 RGB 图像的高效三维目标检测框架，旨在从二维图像中提取三维信息并在无点云或立体数据的情况下确定对象的精确三维边界框。该方法利用二维目标检测器提取表面视觉特征，消除使用二维边界框带来的表征歧义问题，并探索了不同的三维边界框细化方法，发现基于质量感知损失的分类式方法具有更好的性能。在 KITTI 基准测试上，该方法优于当前单个 RGB 图像基础的三维目标检测技术水平。

Mar, 2019