ICLRApr, 2024

OpenNeRF:使用像素级特征和渲染新视图的开放式 3D 神经场景分割

TL;DROpenNeRF 是一种在视觉 - 语言模型中自然地进行操作的方法,通过使用像素级的 VLM 特征,可以在不需要额外的 DINO 规范化的情况下实现更简化的架构,并在 3D 点云分割上优于近期的开放词汇方法,如 LERF 和 OpenScene,至少优势为 + 4.9 mIoU。