May, 2023

大型语言模型链式符号提示引发规划行为

TL;DR本文提出了一种名为自然语言计划(NLP)的基准测试,由包含新颖任务的 Brick World、基于 NLVR 的操作和自然语言导航组成,着重研究 LLMs 在需要理解自然语言描述的虚拟空间环境并进行相应文本操作的复杂计划任务中的表现,发现常规的 ChatGPT 等 LLMs 缺乏复杂计划的能力,因此提出了一种适用于 LLMs 的新方法 CoS,可以更好地表示符号空间表示方法,并在三个计划任务中显著提高了 ChatGPT 的性能。