Jul, 2024

综合多模态问题生成

TL;DR使用 SMMQG 生成合成数据,该方法结合了检索器、大型语言模型和大型多模型,可以直接从多模态文档中生成符合特定样式和形式的问题和答案对,用于对多模态文档进行问答评估,并与现有数据集 MMQA 进行质量对比。