Nov, 2023

ChEF: 一个综合评估框架用于对多模态大型语言模型进行标准化评估

TL;DR通过构建全面的评估框架(ChEF),对多模态大语言模型(MLLMs)的能力和限制进行标准化和全面的评估,以及提出新的评估方法和模型集成工具包,以促进 MLLM 社区的进一步分析和发展。