ACLJun, 2024
SpaRC 和 SpaRP:用于理解大型语言模型的空间推理能力的空间推理特征描述和路径生成
SpaRC and SpaRP: Spatial Reasoning Characterization and Path Generation for Understanding Spatial Reasoning Capability of Large Language Models
Md Imbesat Hassan Rizvi, Xiaodan Zhu, Iryna Gurevych
TL;DR当前最先进的大型语言模型(LLMs)在空间推理方面性能较差,但随着模型规模的扩大,在空间推理能力上有了显著提升,Finetuning 大或小型语言模型可以显著提高它们的 F1 分数,专有的 LLMs 在拓扑空间理解和推理方面明显优于开源模型。