Feb, 2025

通过基于图表的文档问答生成框架对多模态RAG进行基准测试

TL;DR本研究针对现有基准主要集中于简单图像-文本互动而忽视复杂视觉格式(如图表)这一问题,提出了基于图表的多模态检索增强生成(MRAG)任务。我们引入了一个新的评估框架CHARGE,通过结构化关键点提取和跨模态验证生成高质量评估样本,为图表基础的MRAG评估建立了全面的基准,揭示了当前方法在图表场景中的关键局限。