Jul, 2024
VSP:衡量 VLMs 中空间规划任务中的感知和推理的双重挑战
VSP: Assessing the dual challenges of perception and reasoning in spatial planning tasks for VLMs
Qiucheng Wu, Handong Zhao, Michael Saxon, Trung Bui, William Yang Wang...
TL;DR评估了视觉语言模型(VLMs)在空间规划能力方面的不足,并揭示了模型在视觉感知和推理能力上的根本缺陷以及在空间规划任务中的性能下降,为改进 VLMs 在空间规划方面的能力指明了未来的方向。