层级洞察:利用结构相似性进行可靠的 3D 语义分割
本文研究在自动驾驶应用中对动态场景中的 3D LiDAR 数据进行语义分割。通过使用 3D LiDAR 数据,构建了一个包括范围图像分割、样本生成、数据关联、跟踪级别注释和半监督学习等方面的语义分割系统,使用半监督学习并结合约束数据和少量标注数据对 CNN 分类器进行训练,设计了一种特殊的损失函数,其中鼓励将约束数据分配到同一语义类别。实验表明,少量标注和大量约束数据的组合显著提高了该方法的有效性和场景适应性,效果比以往的方法提高了 10% 以上。
Sep, 2018
通过使用对角层次一致性(DiHC-Net)的鲁棒半监督医学图像分割新框架,实现了几乎达到人类水平的临床应用中的医学图像分割结果,且在公开的左心房(LA)数据集上表现优于以往的方法。
Nov, 2023
该论文提出了一种将几何形状转化为分层分割部件的方法,并使用 “场景图” 和 “部件名称” 建立类别特定模型来训练和分割 3D 形状,最终完成对几何和部件之间的可视化分层和标记,实现了对物体和它们所包含的部分的分层和标记的应用。
May, 2017
本研究提出了一个新的实时卷积神经网络 ——Lite-HDSeg,用于三维激光雷达点云的智能语义分割,在 SemanticKitti 基准测试中取得了最佳的准确度和计算复杂度平衡。本文提出的方法在机器人和自动驾驶应用中是非常适合的。
Mar, 2021
本文提出了一种基于 2D 图像标注来训练 3D 语义分割模型的方法,使用多视角融合来生成伪标签,并解决了选择可信的伪标签、较少目标分类、在训练过程中如何脱离 2D 图像等问题。实验结果表明,所提出的 2D3DNet 网络在一个新的城市数据集上的表现显著优于基线方法。
Oct, 2021
本文介绍了一种基于层次化视觉数据结构的图像分类方法,该方法利用层次聚类创建了可变长度的视觉树,从而更准确地进行分类。该方法在 ILSVRC2010 和 Caltech 256 基准数据集上获得了显著更好的分类准确率。
Sep, 2017
提出了一种全方位理解 3D 场景的通用 3D 分割方法 OmniSeg3D,通过层次对比学习框架将多视图不一致的 2D 分割提升为一致的 3D 特征场,实现了分层分割、多对象选择和全局离散化,并通过大量实验验证了该方法在高质量 3D 分割和准确定义了层次结构方面的有效性,进一步利用图形用户界面实现了灵活的全方位 3D 分割的交互操作。
Nov, 2023
本文旨在研究基于传感器融合技术的三维语义分割,将 RGB 图像转化为 LiDAR 所使用的极坐标网格映射表示,并设计了早期和中期融合架构,同时提出了融合两种算法的混合融合结构。在 KITTI 数据集中评估了所提出算法的效果,并相对于仅使用 LiDAR 的基线模型,在两种最先进的算法 SqueezeSeg 和 PointSeg 上分别提高了 10% 的分割精度。
Jun, 2019
层次化语义分类需要预测一个层次结构树而不是单个层级的树,通过训练分类器来实现不同层级的准确性和一致性,同时结合图像分割以提高一致性和准确性,并引入树路径 KL 散度损失以强制实现跨层级的一致准确预测和预测层次结构树的准确性。
Jun, 2024