Oct, 2024

SPARTUN3D:大型语言模型中的情境空间理解3D世界

TL;DR本研究解决了当前3D基础大型语言模型在情境理解方面的缺陷,主要表现为缺乏具有情境背景的3D数据集以及空间表示与自然语言之间的对齐问题。通过引入镶嵌了多种情境空间推理任务的可扩展数据集Spartun3D,并与一个新的情境空间对齐模块结合,该研究显著提高了3D视觉表示与文本描述之间的对齐性能,进而改善了3D基础大型语言模型的情境空间理解能力。