Nov, 2024

评估视觉语言模型在路径规划中的评估能力

TL;DR本研究针对大型语言模型在端到端规划中的有效性有限的问题,探讨视觉语言模型(VLMs)作为路径评估者的潜力。文章提出了PathEval,一个新的基准,用于评估VLMs在复杂路径规划场景中的表现,发现目前的VLM面临显著挑战,特别是在低级细节感知上的瓶颈。实验结果表明,充分发挥VLM作为路径评估者的能力需要针对任务的特定适应。