Geodesic-Former: 基于测地线引导的少样本 3D 点云实例分割器
本文提出了一种统一、简单、有效的模型 OneFormer3D,利用可学习的卷积核同时处理实例分割和语义分割,通过输入统一的实例和语义查询来训练,并在 ScanNet 测试排行榜中取得了第一名和新的最佳性能,同时在 ScanNet、ScanNet200 和 S3DIS 数据集上展示了最领先的语义、实例和全景分割结果。
Nov, 2023
本文提出 PSGformer,一种新颖的 3D 实例分割网络,通过多级语义聚合模块和平行特征融合 Transformer 模块,完整地利用全局和局部语义信息,有效提高了分割水平,实现在 ScanNetv2 数据集上取得了当前最佳结果。
Jul, 2023
本文提出了一种名为 SphereFormer 的方法,通过设计射线窗口自我关注机制,将密集的近距离点聚集到稀疏的远距离点,从而扩大感受野,提高了稀疏远距离点的性能,并在 nuScenes 和 SemanticKITTI 语义分割基准测试排名第一,取得了显著的性能提升。
Mar, 2023
在动态测试环境中,现有的全监督点云分割方法无法应对新出现的类别。为解决这一问题,少样本点云分割算法通过学习适应新类别,但会牺牲对基类别的分割准确性,从而严重影响其实用性。因此,我们首次尝试了更实用的广义少样本点云分割范式,要求模型能够同时推广到用仅有少量支持点云表示的新类别,并保持对基类别的分割能力。我们提出了几何单词来表示基类别和新类别之间共享的几何组件,并将其融入新型几何感知语义表示中,以更好地推广到新类别而不会遗忘旧类别。此外,我们引入几何原型来利用几何先验知识来引导分割。在 S3DIS 和 ScanNet 上进行的大量实验证明了我们方法在基准方法上的卓越性能。
Sep, 2023
通过整合 LiDAR 和图像数据,4D-Former 方法在 4D 全景分割任务上取得了最先进的结果,能够为 LiDAR 序列中的每个点分配语义类别标签和进行对象分割,并能在时间上保持一致的对象分割遮罩。
Nov, 2023
本文提出了一种针对 3D 目标检测的模型 Sparse Window Transformer(SWFormer),它能够充分利用点云数据的稀疏性,并通过 “桶” 技术对不同长度的稀疏窗口有效地进行处理。在 Multi-scale 特征融合和窗口偏移操作的基础上,作者还引入了新的体素扩散技术。最终,在 Waymo Open Dataset 上的实验结果表明,SWFormer 相比于所有先前的单阶段和两阶段模型,取得了最新的 73.36 L2 mAPH 表现,同时更加高效。
Oct, 2022
本文提出了 Query-Guided Prototype Adaption (QGPA) 模块并通过引入 Self-Reconstruction (SR)来增强原型的表示以适应点云的大内部类特征差异和极少量数据,最终在 S3DIS 和 ScanNet 基准测试中超越最先进的算法,其中还考虑到零样本的情况
May, 2023
通过引入一种名为 D3Former 的基于显著性引导的变换器模型,联合学习可重复的稠密检测器和增强特征的描述符,实现了准确匹配点云问题的关键步骤,实验证明该方法在室内和室外基准测试中始终优于最先进的点云匹配方法。
Dec, 2023
本文提出了一种基于中心点的变换网络 ——CenterFormer,它使用查询嵌入来聚合中心候选点的特征向量,并设计了一种通过交叉注意力来融合多帧特征的方法。在 Waymo Open 数据集上,CenterFormer 在单个模型上实现了先进水平,取得了 73.7% 的验证集和 75.6% 的测试集 mAPH, 显著优于以前所有已发表的基于 CNN 和 transformer 的方法。
Sep, 2022
本论文提出了一种基于 Transformer 的场景语义补全框架 VoxFormer,可以从 2D 图像中输出完整的 3D 体素语义,并在测试中获得了相对 20% 的几何和 18.1% 的语义方面的提升。
Feb, 2023