Apr, 2024

3DBench:可扩展的 3D 基准测试和指令调优数据集

TL;DR评估多模态大型语言模型(MLLMs)的性能,集成点云和语言,面临重大挑战。缺乏全面评估阻碍确定这些模型是否真正代表进步,从而妨碍该领域的进一步发展。我们引入了可扩展的3D基准测试和大规模指令调整数据集3DBench,提供了一个全面评估MLLMs的可扩展平台,以解决这些问题。该基准测试覆盖了从物体级到场景级的广泛空间和语义范围,涉及感知和规划任务,并且我们提出了一个严格的流程来自动生成可扩展的3D指令调整数据集,总共涵盖了10个多模态任务,共生成了超过23万个问答对。通过对热门MLLMs的彻底实验评估、与现有数据集的比较以及训练方案的变异,我们展示了3DBench的优越性,为当前的局限性和潜在研究方向提供了有价值的见解。