Jan, 2024
MM-SAP:评估多模态大型语言模型在感知领域自感知能力的综合基准
MM-SAP: A Comprehensive Benchmark for Assessing Self-Awareness of Multimodal Large Language Models in Perception
Yuhao Wang, Yusheng Liao, Heyang Liu, Hongcheng Liu, Yu Wang...
TL;DR通过引入知识象限来定义知道与不知道的知觉,我们针对自我知觉在图像感知方面提出了一个评估多模态大型语言模型的自我感知能力的新型基准测试(MM-SAP),通过评估八种知名的多模态大型语言模型的自我感知能力,提供了详细的洞察。