Jun, 2024

多模态编辑中的关键问题

TL;DR这篇论文介绍了第一个专门设计来系统评估现有多模态大型语言模型对长文本多模态内容理解能力的基准测评 MM-NIAH,并指出现有模型在这些任务上仍有显著的改进空间,特别是在以视觉为中心的评估上。