Nov, 2023
ChEF: 一个综合评估框架用于对多模态大型语言模型进行标准化评估
ChEF: A Comprehensive Evaluation Framework for Standardized Assessment of Multimodal Large Language Models
Zhelun Shi, Zhipin Wang, Hongxing Fan, Zhenfei Yin, Lu Sheng...
TL;DR通过构建全面的评估框架(ChEF),对多模态大语言模型(MLLMs)的能力和限制进行标准化和全面的评估,以及提出新的评估方法和模型集成工具包,以促进 MLLM 社区的进一步分析和发展。