通过查询相机特征重构 LiDAR 数据的 MaskedFusion360

ICLRJun, 2023

通过查询相机特征重构 LiDAR 数据的 MaskedFusion360

MaskedFusion360: Reconstruct LiDAR Data by Querying Camera Features

Royden Wagner, Marvin Klemp, Carlos Fernandez Lopez

TL;DR本研究提出了一种自监督的方法，融合了激光雷达和摄像头数据，训练深度学习模型从融合的数据中恢复遮挡的激光雷达数据，并且通过在稠密球形 LiDAR 投影中融合鱼眼相机裁剪的特征，与使用鸟瞰表示法进行的相关方法相比，减少了视场变换的学习和额外模块的需求。

Abstract

In self-driving applications, lidar data provides accurate information about distances in 3D but lacks the semantic richness of camera data

self-driving applications lidar data camera data perception deep learning models

发现论文，激发创造

DeepFusion: 基于 Lidar 和相机的深度融合技术用于多模态 3D 物体检测

本文介绍了一种通过将 lidar 特征与摄像头特征融合的方法来提高自动驾驶 3D 检测性能。基于 InverseAug 和 LearnableAlign，提出了一系列被称为 DeepFusion 的通用多模态 3D 检测模型，实现了对 PointPillars、CenterPoint 和 3D-MAN 基线的有效改进，表现出对输入异常和数据偏移的强大鲁棒性和最先进的性能，可公开获取代码

Mar, 2022

自主移动机器人的 LiDAR 和广角相机数据的强健融合

该论文介绍了使用 LiDAR 和摄像头进行传感器数据融合以实现自主机器人的自由空间检测，并通过高斯过程回归的分辨率匹配算法来更好地利用多模式传感器数据流以提高感知步骤的性能表现。

Oct, 2017

MSMDFusion: 多尺度深度种子融合 LiDAR 和摄像头进行 3D 物体检测

基于激光雷达和摄像头信息的融合对于实现自动驾驶系统中的准确可靠的三维物体检测至关重要。在该文中，提出了一种新颖的框架，其中利用了深度信息和激光雷达与摄像头之间的交互，实现更全面的多模态融合特征，并在 nuScenes 测试基准中取得了最新的 3D 目标检测结果，同时无需使用测试时间增广和集成技术。

Sep, 2022

基于神经渲染的自动驾驶城市场景重建

利用多模态数据结合深度学习模型进行密集三维重建，从而提高自动驾驶中的标注验证、数据扩充、缺失 LiDAR 系统的地面真值注释以及自动标记准确性的应用效果。

Feb, 2024

基于占据估计的汽车激光雷达自我监督

本论文提出一种基于自监督学习的点云深度感知模型预训练方法，通过表面重建预训练任务和基于潜在向量的感知头来抓取表面信息的语义片段并提高对象检测和场景语义分割性能。

Dec, 2022

自动驾驶中多视角传感器数据融合提升感知和预测

本文提出了一种利用多视角 LiDAR 返回和摄像头图像的终端到终端物体检测和轨迹预测方法，使用 Bird's-Eye View (BEV) 网络的状态 -of-the-art 融合历史 LiDAR 数据和高清地图的体素化特征来执行检测和预测任务。在此基础上，我们使用 LiDAR Range-View （RV）功能扩展了此模型，使用 LiDAR 原始信息的非量化表示。RV 特征图被投影到 BEV 中，并与计算自 LiDAR 和高清地图的 BEV 特征融合。最终输出检测和轨迹，这是一个单一的可训练终端到终端网络。在实际的无人驾驶车辆数据和公共 nuScenes 数据集上，所提出的多视角融合方法的表现都优于最先进的技术，并且增加了较少的计算成本。

Aug, 2020

基于激光雷达 - 相机融合技术的三维目标检测鲁棒性评估

本研究针对自动驾驶的核心传感器进行研究，发现同时融合相机和 LiDAR 两种模式可以显著提升其性能。然而，由于当前数据集来自于昂贵的数据收集车辆，无法完全反映真实数据分布。因此，我们提出了一种系统性的鲁棒性基准测试工具包，并在 nuScenes 和 Waymo 中建立了鲁棒性基准测试，针对当前的融合方法进行综合性分析。最后，我们提出了一种高效的鲁棒性训练策略。

May, 2022

3D-CVF：使用跨视角空间特征融合生成联合相机和激光雷达特征进行 3D 物体检测

提出了一种新的深度架构，用于将相机和 LiDAR 传感器融合以进行 3D 物体检测，该方法称为 3D-CVF，通过交叉视图空间特征融合策略，使用自动校准投影将相机和 LiDAR 特征组合，该方法在 KITTI 基准测试中实现了最先进的性能。

Apr, 2020

感知感知多传感器融合用于 3D LiDAR 语义分割

本文章提出了一种基于感知信息的多传感器融合策略（PMF），用于自动驾驶等应用中的 3D LiDAR 语义分割，通过两个模态的外观和空间深度信息进行感知信息融合并且提出了感知相关的损失函数用于衡量两种模式之间的差异性，实验结果证明了该方法的优越性。

Jun, 2021

基于金字塔融合网络的深度传感器融合技术用于三维语义分割

本文提出了一种基于金字塔结构的深度融合体系结构，用于提高交通场景的 3D 语义分割效果，它可以将相机图像和激光雷达的特征图从不同层次进行融合，并结合多模态特征计算出有价值的多尺度特征以进行更准确的 3D 语义分割。

May, 2022