自监督预训练提升激光雷达数据的语义场景分割

Sep, 2023

自监督预训练提升激光雷达数据的语义场景分割

Self-Supervised Pre-Training Boosts Semantic Scene Segmentation on LiDAR data

Mariona Carós, Ariadna Just, Santi Seguí, Jordi Vitrià

TL;DR通过使用 Barlow Twins 训练自监督编码器进行预训练，我们提出了一种技术来从未标记的数据中学习，从而显著减少注释样本的数量，并在语义场景分割任务中应用。实验结果表明，我们的无监督预训练在有监督任务上进行微调后可提高性能，特别是对于少数类别。

Abstract

airborne lidar systems have the capability to capture the Earth's surface by generating extensive point cloud data comprised of points mainly defined by 3D coordinates. However, labeling such points for

airborne lidar systems point cloud data supervised learning self-supervised encoder semantic scene segmentation

发现论文，激发创造

基于占据估计的汽车激光雷达自我监督

本论文提出一种基于自监督学习的点云深度感知模型预训练方法，通过表面重建预训练任务和基于潜在向量的感知头来抓取表面信息的语义片段并提高对象检测和场景语义分割性能。

Dec, 2022

自监督激光雷达分割用于自主室内导航学习

本研究提出了一种自监督学习方法用于激光雷达帧的语义分割，通过结合 SLAM 和光线追踪算法实现自动化注释，训练预测机器人移动场景中的固定结构和可动目标的深度学习模型，同时改进机器人的导航和本地化性能，为机器人导航和目标定位提供了新的途径。

Dec, 2020

自助学习多模态预训练在 3D 目标检测中的应用

通过使用与图像相关的 shelf-supervision 模型对配对的 RGB 和 LiDAR 数据进行无监督预训练，我们提出了一种能够生成零样本 3D 边界框的点云表示方法，这种方法在半监督检测中能够显著提高检测准确性，尤其适用于 LiDAR-only 和多模态 (RGB + LiDAR) 检测。我们在 nuScenes 和 WOD 上展示了我们方法的有效性，并在有限数据环境中明显改进了之前的工作。

Jun, 2024

自监督镜像雷达蒸馏用于自动驾驶数据

该研究提出了一种针对自动驾驶数据量身定制的自监督 3D 感知模型预训练方法，使用 superpixels 来池化 3D 点特征和 2D 像素特征，训练 3D 网络来匹配虚拟对应的 2D 像素特征并提取特征，从而实现无需任何点云或图像注释的 3D 语义分割和车辆物体检测，进行了大量的自动驾驶数据集实验以证明其有效性。

Mar, 2022

半监督学习在动态场景三维 LiDAR 数据语义分割中的应用

本文研究在自动驾驶应用中对动态场景中的 3D LiDAR 数据进行语义分割。通过使用 3D LiDAR 数据，构建了一个包括范围图像分割、样本生成、数据关联、跟踪级别注释和半监督学习等方面的语义分割系统，使用半监督学习并结合约束数据和少量标注数据对 CNN 分类器进行训练，设计了一种特殊的损失函数，其中鼓励将约束数据分配到同一语义类别。实验表明，少量标注和大量约束数据的组合显著提高了该方法的有效性和场景适应性，效果比以往的方法提高了 10% 以上。

Sep, 2018

任意点云的自监督 3D 特征预训练

该研究提出了一种可用于 3D 数据的简单自监督预训练方法，在目标检测、语义分割和物体分类等方面取得了最先进的结果并提高了少样本类别的性能。

Jan, 2021

基于地势信息的自主学习：利用有限注释增强 LiDAR 数据中的建筑物提取

使用地面高程模型和自我监督学习的方法，在建筑物分割地图中利用少量标签数据取得了较好的效果，对于在遥感领域中提取特征具有高效性和有效性。

Nov, 2023

增强型自监督聚类学习：应用于土地覆盖地图制作

通过聚类为自监督学习的前提任务，提出了一种用于土地覆盖映射的方法，通过所得聚类结构进行主动采样，提高映射准确性。

Aug, 2021

一种用于机器人大规模 LiDAR 场景解析的高效框架

本文介绍了一种在有限标签情况下解决点云理解问题的通用简单框架，通过无监督区域扩展的聚类方法生成聚类，并结合地理特征相似性和语义特征相似性在弱标签监督下学习合并过度细分的聚类，以及自监督重建和数据增强优化模块引导标签在场景中语义相似点之间的传播。实验证明，该框架在大规模 3D 语义场景解析的数据效率设置下，在语义分割、实例分割和目标检测等三个重要弱监督点云理解任务中表现最佳，所开发技术还具有对机器人操作和自主导航中的下游任务提供更好表示的潜力。代码和模型可在链接处公开获取。

Dec, 2023

AutoInst: LiDAR 3D 扫描的自动实例分割

通过无监督学习的方法，使用 LiDAR 传感器，构建了一个算法来预测 3D 场景中的实例分割，其中通过权重代理图生成 3D 实例掩模建议，并使用自我训练算法对初始嘈杂的提议进行强化，以生成场景级实例分割。在 SemanticKITTI 基准测试中，该方法相较于最佳基准模型获得了 13.3% 的平均准确率和 9.1% 的 F1 分数提升。

Mar, 2024