Apr, 2024

MM-PhyQA:多模态物理问题回答与多图 CoT 提示

TL;DR利用现有模型对多步骤物理推理任务进行评估,通过引入多模态元素的高中级别物理问题的新数据集 MM-PhyQA,测试了包括 GPT-4 和 LLaVA 在内的多个大型语言模型的性能,并展示了基于 MI-CoT 提示技术的 LLaVA-1.5 13b 模型在测试集上的最佳结果,具有最高的 71.65% 准确率。