LLM+P:利用最优规划提升大型语言模型的性能
NL2Plan 是第一个通用领域脱机驱动计划系统,利用大型语言模型通过逐步提取必要信息从短文本提示创建完整的 PDDL 描述,进而通过经典计划器解决问题,提供解决 15 个任务中 10 个任务的改进以及提高可解释性和 PDDL 创建协助工具的功能。
May, 2024
本研究引入了一种新的方法,使用 PDDL 语言构建显式世界模型,并利用预训练的大型语言模型作为 PDDL 和校验器等纠正反馈的接口,以提高计划问题的效率和准确性。在不涉及用户互动的情况下,通过验证 PDDL 模型的正确性,我们制定计划来解决复杂任务并取得成功。
May, 2023
通过结合经典规划和大型语言模型的优势,我们实现了基于 LLMs 的目标分解,提高了计划的速度和执行成功,并且比单一代理计划少了更少的执行步骤,同时实现了与人类专家指定的多代理执行步骤类似的结果。
Mar, 2024
本文旨在研究 LLLms 在常识规划任务中的规划能力,通过在国际计划竞赛中生成一系列实例,并评估 LLMs 在自主规划和启发式两种不同模式下的表现,发现 LLMs 在自主规划方面的表现非常有限,但在启发式模式下,LLMs 生成的计划可以改善其它智能计划器的搜索过程并提供反馈以进一步验证计划质量。
May, 2023
本研究探讨了大型语言模型是否能够将自然语言的目标翻译成结构化的计划语言。我们使用 GPT 3.5 变种进行了实验,结果表明大型语言模型更适合进行翻译而不是规划,虽然这些模型能够利用常识知识和推理填补自然语言目标中缺失的细节,但在涉及到数字或物理推理的任务中,它们可能会出现失败,并且对所使用的提示信息很敏感。
Feb, 2023
本研究使用大型语言模型 (Large Language Models, LLMs) 作为规划师,以完成视觉感知环境中的复杂任务的具有身体接口的代理人。研究提出了 LLM-Planner 方法进行 few-shot planning,同时提出通过物理接口增强 LLMs 的简单而有效的方法,实验结果表明该方法在 ALFRED 数据集上能够取得与使用全数据训练的基线模型相当的性能。
Dec, 2022