Dec, 2023

M3DBench:利用多模态 3D 提示指导大型模型

TL;DR我们引入了一个名为 M3DBench 的全面的 3D 指令跟随数据集,支持多模式指令与文本、图像、3D 物体和其他视觉提示相互交错,统一了不同的 3D 任务,是一个大规模的 3D 指令跟随数据集,收集了超过 320,000 个指令响应对,并建立了一个评估大型模型在理解多模态 3D 提示方面性能的新基准。广泛的实验证明了我们数据集和基准模型的有效性,支持通用的 3D 中心任务,这将激发未来的研究。