Oct, 2023

Open-NeRF:面向开放词汇的 NeRF 分解

TL;DR该研究关注解决从开放词汇中将神经辐射场(NeRF)分解为对象的挑战,这对于三维重建和视图合成中的对象操作是至关重要的。我们提出了 Open-NeRF,利用大规模、现成的分割模型,如 Segment Anything Model(SAM),并引入了一种集成和蒸馏范式,通过层次嵌入来既实现开放词汇查询的灵活性,又保持三维分割的准确性。Open-NeRF 首先利用大规模的基础模型根据不同视角生成分层的二维掩模提案,然后通过跟踪方法对这些提案进行对齐,并在三维空间中进行集成,最后蒸馏为三维场。该过程确保了不同视角下的对象一致识别和细粒度,即使在涉及遮挡和模糊特征的挑战性场景中也是如此。实验结果表明,Open-NeRF 在开放词汇的场景中胜过了 LERF 和 FFD 等最先进的方法。Open-NeRF 为 NeRF 分解提供了一个有前途的解决方案,通过开放词汇查询引导,能够在开放世界的三维场景中实现新的机器人和视觉语言交互应用。