Jun, 2024

VLind-Bench:大型视觉-语言模型中的语言先验测量

TL;DR通过新的基准测试VLind-Bench,本研究评估和分析了近期的大型视觉语言模型(LVLMs),发现几乎所有模型都过度依赖于语言先验,这对该领域构成了巨大挑战。