Oct, 2024
理解大型语言模型在多模态评估基准中的作用
Understanding the Role of LLMs in Multimodal Evaluation Benchmarks
TL;DR本研究解决了多模态大型语言模型(MLLMs)评估中对多模态推理能力和大语言模型(LLM)骨干的过度依赖的问题。通过提出改进的评估协议和自动知识识别技术,我们发现当前评估基准可能忽视视觉输入的重要性,并指出LLM骨干知识不足对性能的显著影响。研究表明,知识增强管道可以提升性能,提供了对LLM骨干在MLLM中的关键作用的深刻洞见。