Jul, 2024

MMLongBench-Doc: 用视觉化评估长上下文文档理解技术的基准测试

TL;DR通过构建一个多模式长上下文的基准数据集,本研究表明长上下文文档理解对于当前的大型视觉 - 语言模型 (LVLMs) 来说是个巨大挑战,并验证了未来研究更强大的长上下文 LVLMs 的必要性。