May, 2024

从博弈论视角诊断视觉语言模型的组合知识

TL;DR通过评估不同方面的结构性理解,例如关系和属性,系统地揭示了视觉语言模型在结构性推理方面的弱点,并提供了有用且可靠的指导,以便未来的研究。