Apr, 2025
视觉语言模型在神经心理学测试中显示广泛的视觉缺陷
Visual Language Models show widespread visual deficits on
neuropsychological tests
TL;DR本研究探讨了视觉语言模型(VLM)在处理基本视觉概念(如方向、位置、连续性和遮挡)时的困境,揭示了它们与人类视觉之间的差距。通过系统地评估三种先进的VLM在视觉领域的能力,发现尽管模型在物体识别任务中表现出色,但在低级和中级视觉能力上存在广泛缺陷,这些缺陷在人类中被视为临床显著。