Jun, 2024
SpaRC和SpaRP:用于理解大型语言模型的空间推理能力的空间推理特征描述和路径生成
SpaRC and SpaRP: Spatial Reasoning Characterization and Path Generation
for Understanding Spatial Reasoning Capability of Large Language Models
TL;DR当前最先进的大型语言模型(LLMs)在空间推理方面性能较差,但随着模型规模的扩大,在空间推理能力上有了显著提升,Finetuning大或小型语言模型可以显著提高它们的F1分数,专有的LLMs在拓扑空间理解和推理方面明显优于开源模型。