May, 2023

大型语言模型链式符号提示引发规划行为

TL;DR本文提出了一种名为自然语言计划(NLP)的基准测试,由包含新颖任务的Brick World、基于NLVR的操作和自然语言导航组成,着重研究LLMs在需要理解自然语言描述的虚拟空间环境并进行相应文本操作的复杂计划任务中的表现,发现常规的ChatGPT等LLMs缺乏复杂计划的能力,因此提出了一种适用于LLMs的新方法CoS,可以更好地表示符号空间表示方法,并在三个计划任务中显著提高了ChatGPT的性能。