Aug, 2024

更多文本,更少点:迈向3D数据高效的点-语言理解

TL;DR本研究解决了大型语言模型在理解3D物理世界时缺乏大规模3D-文本对数据集的问题。通过引入GreenPLM,我们利用更多文本数据来弥补3D数据的不足,实现了对3D对象的稳健理解。实验结果表明,GreenPLM只需12%的3D训练数据就能实现卓越的3D理解能力,并且在仅使用文本数据时也能表现出竞争力。