Jul, 2024

VSP:衡量 VLMs 中空间规划任务中的感知和推理的双重挑战

TL;DR评估了视觉语言模型(VLMs)在空间规划能力方面的不足,并揭示了模型在视觉感知和推理能力上的根本缺陷以及在空间规划任务中的性能下降,为改进 VLMs 在空间规划方面的能力指明了未来的方向。