Jun, 2024

超越裸露询问:使用 3D 场景图进行开放词汇物体检索

TL;DR通过提出模块化方法 BBQ(Beyond Bare Queries),结合构建 3D 场景空间图表示、套用大型语言模型以及深度推理算法,本研究成功实现了生成准确的 3D 物体中心地图、应用于开放词汇 3D 语义分割、并具备在复杂查询中通过使用空间关系检索物体的能力,并且其处理速度比最近的类似方法快大约三倍。