Mar, 2024

高效三维实例映射和定位

TL;DR我们提出了一种新的框架 3DIML,用于从一系列姿态 RGB 图像中学习隐式场景表示,以实现 3D 实例分割,该框架可以有效地学习一个标签场,并且可以在新视角中进行渲染,生成视图一致的实例分割掩码。我们通过对 Replica 和 ScanNet 数据集的序列进行评估,展示了 3DIML 在图像序列的轻度假设下的有效性,相比具有相似质量的现有方法,我们取得了 14-24 倍的加速,展示了它在加快和提高 3D 场景理解方面的潜力。