基于颜色化的预训练 LiDAR 三维目标检测器
本论文提出了一种通过几何 - 颜色对比(Point-GCC)对点云进行 3D 场景预训练的通用框架,该框架在几何和颜色信息之间建立联系,并包括分层监督、新型深度聚类模块、体系结构不可知的后端等设计,实现了在各项数据集上的显著效果提升,包括 SUN RGB-D 和 S3DIS 之类的异常检测结果。
May, 2023
本文提出了一种新的多模态视觉定位任务,称为 LiDAR Grounding,并通过设计一种名为 MSSG 的多模态单次定位方法来实现,通过跨模态学习来提高定位精度和效率。
May, 2023
通过使用粗略标签和无标签雷达点云伪标签,LPCG 可以在自动驾驶系统中显著降低标注成本或显著提高检测准确性,在 KITTI 基准测试和 Waymo 基准测试中都取得了很好的效果。
Apr, 2021
通过场景补全预训练(SCP)方法来增强 3D 物体检测器的性能,SCP 具有改进点云模型初始化、消除对额外数据集的需求、减少标注数据量的三个关键优势,并能够使现有的 3D 检测器仅依赖 20% 标注数据即可实现相当性能。
Sep, 2023
本文介绍了一种新的标注方法,将人类监督与预训练的神经网络相结合,生成每个实例的三维点云分割,三维边界框和类别注释,以减少训练自动驾驶的 3D 物体检测器所需的任务复杂性和注释人员所需的任务切换量,实验结果表明,该方法相比传统方法减少了 30 倍人工标注时间。
Jul, 2018
本文提出了一种用于改善现有 3D 目标检测器的特征学习的标签指导辅助训练方法,该方法包括两个模块:一个用于将注释和点云映射到特定任务表示的标签注释诱导器和一个协助原始特征获取检测关键表示的标签知识映射器。在室内和室外数据集上的广泛实验验证了该方法的有效性。
Jul, 2022
本文提出了一种称为 GCP-Colorization 的自动上色方法,它利用先前预训练的生成对抗网络(GAN)中丰富且多样化的颜色先验知识,并利用 GAN 编码器 “检索” 匹配特征,然后通过引入特征调节到上色过程中,实现了单次前向传递产生生动颜色的效果,此外,该方法具有可解释性和可控性,并能够通过修改 GAN 潜在代码获得不同的结果。
Aug, 2021
本文提出了一种自动驾驶中单目三维物体检测框架,着重解决了二维图像数据的不足,通过将输入数据从二维图像平面转换为三维点云空间进行处理,并使用 PointNet 网络进行三维检测,以提高点云的辨别能力,同时利用多模态融合模块将 RGB 颜色信息融入点云表示,证明了在三维空间中推断三维包围盒比在二维图像平面中更加有效,经过在 KITTI 数据集上的评估,该方法的表现超过现有最新的单目方法。
Mar, 2019
无人驾驶车辆中的目标检测与跟踪任务主要依靠相机和 LiDAR 等多种传感器,本研究在使用 LiDAR 点云的新编码方式基础上,通过推断自动驾驶车辆附近不同类别物体的位置,实现了对场景中物体位置和方向的预测。
Dec, 2023
通过无缝融合 RGB 传感器到 Lidar 的 3D 识别中,我们提出了一个简单而有效的多模态检测器,该方法利用一组 2D 检测生成密集的虚拟 3D 点,能够增强原来稀疏的 3D 点云,实验结果在大规模 nuScenes 数据集上取得了显着的改进,并超过了竞争融合方法。
Nov, 2021