May, 2024
从博弈论视角诊断视觉语言模型的组合知识
Diagnosing the Compositional Knowledge of Vision Language Models from a Game-Theoretic View
Jin Wang, Shichao Dong, Yapeng Zhu, Kelu Yao, Weidong Zhao...
TL;DR通过评估不同方面的结构性理解,例如关系和属性,系统地揭示了视觉语言模型在结构性推理方面的弱点,并提供了有用且可靠的指导,以便未来的研究。