In the past few years, we have seen great progress in perception algorithms,
particular through the use of deep learning. However, most existing approaches
focus on a few categories of interest, which represent o
通过无监督学习的方法,使用 LiDAR 传感器,构建了一个算法来预测 3D 场景中的实例分割,其中通过权重代理图生成 3D 实例掩模建议,并使用自我训练算法对初始嘈杂的提议进行强化,以生成场景级实例分割。在 SemanticKITTI 基准测试中,该方法相较于最佳基准模型获得了 13.3% 的平均准确率和 9.1% 的 F1 分数提升。
已有的 3D 实例分割方法通常假设在训练过程中可获取所有待分割的语义类别,并在推理时仅分割已见类别。我们认为这种封闭世界的假设过于限制,首次探索了在开放世界环境中进行 3D 室内实例分割,使模型能够区分已知类别,并将未知对象标注为未知,并在相应的类别标签可用时逐步学习未知对象的语义类别。为此,我们引入了一种开放世界的 3D 室内实例分割方法,其中采用自动标注方案在训练过程中生成伪标签,并引入分离机制来区分已知和未知类别标签。我们还通过基于目标性得分分布调整未知类别概率的方法,在推理过程中改进了伪标签的质量。我们还引入了基于真实场景的谨慎策划的开放世界数据集,根据物体分布、基于区域的室内场景探索和开放世界类别的随机性方面。广泛的实验表明了所提出的方法有效性,为开放世界 3D 实例分割性能带来了希望。