LLM 动态规划

Aug, 2023

Dynamic Planning with a LLM

Gautier Dagan, Frank Keller, Alex Lascarides

TL;DR大型语言模型与符号规划器结合的神经符号框架，为解决涉及体验代理的复杂计划任务提供更快速和高效的解决方案。

Abstract

While large language models (LLMs) can solve many NLP tasks in zero-shot settings, applications involving embodied agents remain problematic. In particular, complex plans that require →

large language models embodied agents multi-step reasoning symbolic planners neuro-symbolic framework

发现论文，激发创造

LLM-Planner: 借助大型语言模型进行少样本基于实例的具身 agent 规划

本研究使用大型语言模型 (Large Language Models, LLMs) 作为规划师，以完成视觉感知环境中的复杂任务的具有身体接口的代理人。研究提出了 LLM-Planner 方法进行 few-shot planning，同时提出通过物理接口增强 LLMs 的简单而有效的方法，实验结果表明该方法在 ALFRED 数据集上能够取得与使用全数据训练的基线模型相当的性能。

Dec, 2022

LLM+P：利用最优规划提升大型语言模型的性能

本文介绍了 LLM + P 框架，将经典计划器的优点结合到大语言模型中，可以通过自然语言描述解决计划问题，经过实验发现 LLM + P 可以提供大多数问题的最优解，而 LLMs 则无法为大多数问题提供甚至可行的计划。

Apr, 2023

AdaPlanner：使用语言模型的自适应反馈规划

本文提出了 AdaPlanner，一种基于闭环反馈的语言模型智能体自适应地改进生成的计划，并通过新的技能发现机制，使其能够在更复杂的任务和环境中实现更好的连续决策性能，实验结果表明 AdaPlanner 在 ALFWorld 和 MiniWoB++ 环境中优于现有的基线算法。

May, 2023

使用 Transformers 生成符号化计划

本文介绍了 Plansformer，这是一个进行了微调的 LLM，可用于自动化规划，并且具有强大的转移学习能力，可适用于解决不同复杂度的规划领域，其中一个 Plansformer 的配置可实现 97% 有效计划，其中 95% 为汉诺塔谜题的最优解。

Dec, 2022

部分可观察机器人任务的大型语言模型交互规划

使用大型语言模型（LLMs）的互动规划技术，通过机器人收集环境中缺失的信息并推断底层问题的状态，从而指导机器人执行所需的动作。

Dec, 2023

利用大语言模型将自然语言转换为计划目标

本研究探讨了大型语言模型是否能够将自然语言的目标翻译成结构化的计划语言。我们使用 GPT 3.5 变种进行了实验，结果表明大型语言模型更适合进行翻译而不是规划，虽然这些模型能够利用常识知识和推理填补自然语言目标中缺失的细节，但在涉及到数字或物理推理的任务中，它们可能会出现失败，并且对所使用的提示信息很敏感。

Feb, 2023

以人为中心的规划

创建基于 LLMs 的规划器（LLMPlan）与能够将文本约束转化为符号表示的符号规划器（SymPlan），通过自我反思的能力以及对自然语言中模糊约束的合并，LLM 基于规划器在 40 名用户的互动评估中表现出优异的用户满意度（70.5%）且不输于传统符号规划器（40.4%）的显式约束满足率。

Nov, 2023

大型部分可观察环境中的顺序计划引导 LLMs

通过结合状态空间搜索和基于自然语言模型的查询，我们提出了一种混合代理方法 neoplanner，以最大化状态值的上界来平衡探索和开发，并通过查询自然语言模型以生成行动计划，进一步提高了大规模状态空间和行动空间的顺序规划的性能。

Dec, 2023

DELTA：基于大型语言模型的分解型高效长期机器人任务规划

提出了一种名为 DELTA 的新型 LLM 驱动的任务规划方法，通过将环境拓扑图作为 LLM 中的环境表示，以快速生成精确的规划问题描述；同时利用 LLM 将长期任务目标分解为自回归的子目标序列，以供自动化任务规划器解决；该方法提供了更高效且完全自动化的任务规划流程，实现了比现有技术更高的规划成功率和显著缩短的规划时间。

Apr, 2024

TwoStep：基于经典规划器和大型语言模型的多智能体任务规划

通过结合经典规划和大型语言模型的优势，我们实现了基于 LLMs 的目标分解，提高了计划的速度和执行成功，并且比单一代理计划少了更少的执行步骤，同时实现了与人类专家指定的多代理执行步骤类似的结果。

Mar, 2024