Jan, 2025
SMIR:高效合成数据管道以改善多图像推理
SMIR: Efficient Synthetic Data Pipeline To Improve Multi-Image Reasoning
TL;DR本研究解决了多图像推理任务中存在的数据规模与评估基准缺乏的问题。我们提出了SMIR,一个高效的合成数据生成管道,能够生成质量高且关联性强的图像及其描述,同时引入了SMIR-BENCH,一个针对多图像推理的新评估基准。研究表明,基于SMIR数据集微调的模型在多图像推理任务中的表现优于基线模型,提升幅度可达8%。