Nov, 2024
MME-Finance:用于专家级理解和推理的多模态金融基准
MME-Finance: A Multimodal Finance Benchmark for Expert-level
Understanding and Reasoning
TL;DR本文针对现有多模态基准无法有效衡量金融领域模型性能的问题,提出了MME-Finance,一个面向实践的双语开放式视觉问答基准。研究发现,在金融相关任务中,一些表现优异的模型在MME-Finance上的表现较差,这表明金融领域的特点需要特定的评估标准。