Mar, 2024

人类和 LLMs 中的视觉对象命名、描述和量化

TL;DR当前的视觉与语言大型语言模型(VLLMs)在捕捉人类命名偏好方面的能力存在问 题,尤其在需要高级推理能力的任务中,例如指定量词。