Lite-HDSeg:使用轻量级谐波密集卷积进行 LiDAR 语义分割
本文旨在研究基于传感器融合技术的三维语义分割,将 RGB 图像转化为 LiDAR 所使用的极坐标网格映射表示,并设计了早期和中期融合架构,同时提出了融合两种算法的混合融合结构。在 KITTI 数据集中评估了所提出算法的效果,并相对于仅使用 LiDAR 的基线模型,在两种最先进的算法 SqueezeSeg 和 PointSeg 上分别提高了 10% 的分割精度。
Jun, 2019
通过提出一种高效的多任务学习框架 LiSD,将分割和检测任务集成在一起,以优化整体性能, 它是一种基于体素的编码器 - 解码器框架,包含分层特征协作和整体信息聚合模块,以及利用跨任务信息的实例感知细化模块。我们在 nuScenes 数据集和 Waymo Open 数据集上进行了实验验证,结果表明我们提出的模型的有效性,尤其是在只使用 lidar 的方法中,LiSD 在 nuScenes 分割基准测试中达到了 83.3%的 mIoU,领先于其他方法。
Jun, 2024
4D LiDAR 语义分割(也称为多扫描语义分割)是增强自动驾驶车辆环境理解能力的关键。本文介绍了 SegNet4D,一种利用基于投影的方法进行快速动态特征编码的实时多扫描语义分割方法,展示了卓越的性能。SegNet4D 将 4D 语义分割视为两个不同的任务:单扫描语义分割和运动目标分割,分别由专用头部解决,然后在提出的运动 - 语义融合模块中进行融合以实现全面的多扫描语义分割。此外,我们提出从当前扫描中提取实例信息,并将其并入网络以实现实例感知分割。我们的方法在多个数据集上表现出卓越的性能,是一种实时多扫描语义分割方法。SegNet4D 的实现将在 https://github.com/nubot-nudt/SegNet4D 上提供。
Jun, 2024
本文研究在自动驾驶应用中对动态场景中的 3D LiDAR 数据进行语义分割。通过使用 3D LiDAR 数据,构建了一个包括范围图像分割、样本生成、数据关联、跟踪级别注释和半监督学习等方面的语义分割系统,使用半监督学习并结合约束数据和少量标注数据对 CNN 分类器进行训练,设计了一种特殊的损失函数,其中鼓励将约束数据分配到同一语义类别。实验表明,少量标注和大量约束数据的组合显著提高了该方法的有效性和场景适应性,效果比以往的方法提高了 10% 以上。
Sep, 2018
本文介绍了一种名为 CENet 的图像语义分割网络,采用卷积而非 MLP,精选的激活函数和多个辅助分割头来提高特征描述能力和降低计算时间复杂度,使用公开的基准测试 SemanticKITTI 和 SemanticPOSS 进行的实验表明,与现有模型相比,我们的模型在 mIoU 和推理性能方面均表现更好。
Jul, 2022
通过使用卷积神经网络和激光雷达数据,本研究旨在提高图像分割的效率,特别是在自动驾驶系统中的道路表面分割任务中,通过减少标注工作量并在不降低分割质量的情况下训练图像分割模型。
Nov, 2023
本文提出了一种利用过去帧信息改善当前帧预测的基于 LiDAR 点云时序的语义分割模型,通过使用记忆网络存储、更新和检索过去信息,并在点云邻域中惩罚预测变化,构建稀疏的 3D 潜在表示来克服遮挡等限制,实验证明该方法在 SemanticKITTI、nuScenes 和 PandaSet 数据集上比现有方法更有效。
Nov, 2023
本文提出了一种名为 HDVNet 的新型架构,针对测量应用程序中的点云具有的大局部密度变化提出解决方案,通过一个嵌套的编码器 - 解码器通路集合来处理特定的点密度范围,有效地处理了输入密度变化,提高了分割精度。
Jul, 2023
本文提出了一种基于三维激光雷达测距扫描和神经网络对语义信息进行提取的建图及定位方法,实现了对运动物体的有效滤波和语义信息约束下的扫描匹配,与现有基于几何约束的方法相比,实验结果表明其性能更优。
May, 2021
本研究提出了一种基于 FPGA 的卷积神经网络 (CNN) 设计,用于实时处理激光雷达数据的道路分割算法。通过在 LiDAR 传感器数据上训练神经网络模型,本文实现了高效的硬件设计,并成功实现每个 LiDAR 扫描的实时处理,实现了道路分割的高精度。
Nov, 2017