3x2:基于2D语义对应的三维物体部件分割
本文介绍了SemanticPaint的实时开源实现,它能够实现几何重建、对象类别分割和3D场景学习;用户可以在佩戴深度相机和虚拟现实头戴设备的情况下,与真实场景进行物理交互并为场景中的对象分配标签,使用在线随机森林机器学习算法对先前未见过的场景部分进行预测,整个过程在实时运行中实现。
Oct, 2015
本文介绍一种通过2D和3D信息交互的方式,构建一个鲁棒性强且方便使用的注释工具,以有效及方便地对大量3D场景数据进行分割和注释,并提供一份使用该工具注释的数据集。
Oct, 2016
本文介绍 PartNet 数据集,该数据集是一个一致的、大规模的、带有精细的、实例级别的和分层的 3D 部分信息的 3D 对象的注释数据集。我们提出了三种评估 3D 部分识别的挑战,包括细粒度语义分割、分层语义分割和实例分割,并基于该数据集进行了实验,结果表明其优越性能。
Dec, 2018
本文提出了一种基于2D图像标注来训练3D语义分割模型的方法,使用多视角融合来生成伪标签,并解决了选择可信的伪标签、较少目标分类、在训练过程中如何脱离2D图像等问题。实验结果表明,所提出的2D3DNet网络在一个新的城市数据集上的表现显著优于基线方法。
Oct, 2021
提出了 PartImageNet 数据集,其中包括了158种类别、约24,000张图像,是一个大、高质量的数据集,具有像素级部位分割注释,能够用于许多视觉任务,包括对象分割、语义部分分割、少样本学习和部分发现。
Dec, 2021
PartSLIP++通过使用预训练的2D分割模型和改进的EM算法,取代其前身的启发式3D转换流程,用于开放世界的3D部分分割任务,表现出更好的性能。
Dec, 2023
鉴于目标物体识别需求,我们介绍了一种称为3D物体推理部分分割的新型细分任务,旨在根据复杂和隐含的文本查询输出一个基于3D物体特定部分的分割蒙版,并提出了一种能够分割3D物体部分的模型,并生成与3D物体分割请求相对应的自然语言解释。
Apr, 2024
这篇论文介绍了一种基于零样本推理的3D分割新任务,以搜索和定位物体的部件为目标,它超越了先前的类别特定3D语义分割、3D实例分割和开放词汇3D分割的限制。我们设计了一个简单的基线方法,Reasoning3D,能够理解和执行复杂的命令,对具有上下文感知和推理答案的3D网格进行(细粒度的)特定部分分割。该方法利用现成的预训练二维分割网络,由大型语言模型(LLMs)支持,在零样本的方式下解释用户的输入查询。我们的方法具有泛化性,能够根据隐含的文本查询有效地定位和突出显示3D对象的部分,包括这些组成部分的3D对象和真实世界的扫描数据。此外,我们的无训练方法可实现快速部署,并成为未来研究中关于部件级3D(语义)对象理解的可行通用基线,在包括机器人学、物体操作、部件装配、自动驾驶应用、增强现实和虚拟现实(AR/VR)以及医疗应用等各个领域发挥作用。该论文提供了代码、模型权重、部署指南和评估协议。
May, 2024
无监督三维实例分割通过在没有任何标注的情况下从三维点云中分割对象。本研究提出了Part2Object方法,基于对象引导的分层聚类。Part2Object从点到对象部分和对象的多层聚类,允许对象在任何层次中显现。此外,它从连续2D RGB帧中提取和利用三维对象的先验信息来指导聚类过程。此外,我们提出Hi-Mask3D来支持分层三维对象部分和实例分割。通过在从Part2Object提取的对象和对象部分上训练Hi-Mask3D,我们在各种设置下实现了一致且优越的性能,包括无监督实例分割,数据高效调优和跨数据集泛化。代码在该链接发布。
Jul, 2024