CVPRMay, 2024

评估零射击 GPT-4V 在 3D 视觉问答基准测试上的表现

TL;DR我们在 3D VQA 基准测试中评估了 GPT-4 Vision 和 GPT-4 等基础模型的零样本性能,发现没有任何微调的 GPT-based agents 在封闭词汇环境中表现与传统建模方法相当,我们还通过与以前的基准测试进行初步比较,希望为改进多模态 3D 基准测试的努力提供信息。