自监督预训练提升激光雷达数据的语义场景分割
本论文提出一种基于自监督学习的点云深度感知模型预训练方法,通过表面重建预训练任务和基于潜在向量的感知头来抓取表面信息的语义片段并提高对象检测和场景语义分割性能。
Dec, 2022
本研究提出了一种自监督学习方法用于激光雷达帧的语义分割,通过结合 SLAM 和光线追踪算法实现自动化注释,训练预测机器人移动场景中的固定结构和可动目标的深度学习模型,同时改进机器人的导航和本地化性能,为机器人导航和目标定位提供了新的途径。
Dec, 2020
通过使用与图像相关的 shelf-supervision 模型对配对的 RGB 和 LiDAR 数据进行无监督预训练,我们提出了一种能够生成零样本 3D 边界框的点云表示方法,这种方法在半监督检测中能够显著提高检测准确性,尤其适用于 LiDAR-only 和多模态 (RGB + LiDAR) 检测。我们在 nuScenes 和 WOD 上展示了我们方法的有效性,并在有限数据环境中明显改进了之前的工作。
Jun, 2024
该研究提出了一种针对自动驾驶数据量身定制的自监督 3D 感知模型预训练方法,使用 superpixels 来池化 3D 点特征和 2D 像素特征,训练 3D 网络来匹配虚拟对应的 2D 像素特征并提取特征,从而实现无需任何点云或图像注释的 3D 语义分割和车辆物体检测,进行了大量的自动驾驶数据集实验以证明其有效性。
Mar, 2022
本文研究在自动驾驶应用中对动态场景中的 3D LiDAR 数据进行语义分割。通过使用 3D LiDAR 数据,构建了一个包括范围图像分割、样本生成、数据关联、跟踪级别注释和半监督学习等方面的语义分割系统,使用半监督学习并结合约束数据和少量标注数据对 CNN 分类器进行训练,设计了一种特殊的损失函数,其中鼓励将约束数据分配到同一语义类别。实验表明,少量标注和大量约束数据的组合显著提高了该方法的有效性和场景适应性,效果比以往的方法提高了 10% 以上。
Sep, 2018
使用地面高程模型和自我监督学习的方法,在建筑物分割地图中利用少量标签数据取得了较好的效果,对于在遥感领域中提取特征具有高效性和有效性。
Nov, 2023
本文介绍了一种在有限标签情况下解决点云理解问题的通用简单框架,通过无监督区域扩展的聚类方法生成聚类,并结合地理特征相似性和语义特征相似性在弱标签监督下学习合并过度细分的聚类,以及自监督重建和数据增强优化模块引导标签在场景中语义相似点之间的传播。实验证明,该框架在大规模 3D 语义场景解析的数据效率设置下,在语义分割、实例分割和目标检测等三个重要弱监督点云理解任务中表现最佳,所开发技术还具有对机器人操作和自主导航中的下游任务提供更好表示的潜力。代码和模型可在链接处公开获取。
Dec, 2023
通过无监督学习的方法,使用 LiDAR 传感器,构建了一个算法来预测 3D 场景中的实例分割,其中通过权重代理图生成 3D 实例掩模建议,并使用自我训练算法对初始嘈杂的提议进行强化,以生成场景级实例分割。在 SemanticKITTI 基准测试中,该方法相较于最佳基准模型获得了 13.3% 的平均准确率和 9.1% 的 F1 分数提升。
Mar, 2024