Sep, 2024

视觉语言模型的眼科检查:指导与检测视觉能力

TL;DR本研究针对视觉语言模型(VLMs)在视觉感知方面的理解不足,提出了一种眼科检查方法,以评估VLM对图像的感知能力。研究发现VLM对不同颜色的敏感性存在差异,尤其对绿色表现出普遍的不敏感,表明VLM的设计与输入处理有潜力改善其在应用中的表现。