Mar, 2025

VisualWebInstruct:通过网络搜索扩展多模态指令数据

TL;DR本研究解决了多模态推理数据集稀缺的问题,提出了VisualWebInstruct这一新方法,利用搜索引擎创建涵盖数学、物理等多个学科的高质量多样化数据集。研究表明,经过VisualWebInstruct微调的模型在推理能力上显著提升,展示了该数据集在复杂多模态任务中的有效性。