LLM 动态规划
本研究使用大型语言模型 (Large Language Models, LLMs) 作为规划师,以完成视觉感知环境中的复杂任务的具有身体接口的代理人。研究提出了 LLM-Planner 方法进行 few-shot planning,同时提出通过物理接口增强 LLMs 的简单而有效的方法,实验结果表明该方法在 ALFRED 数据集上能够取得与使用全数据训练的基线模型相当的性能。
Dec, 2022
本文介绍了 LLM + P 框架,将经典计划器的优点结合到大语言模型中,可以通过自然语言描述解决计划问题,经过实验发现 LLM + P 可以提供大多数问题的最优解,而 LLMs 则无法为大多数问题提供甚至可行的计划。
Apr, 2023
本文提出了 AdaPlanner,一种基于闭环反馈的语言模型智能体自适应地改进生成的计划,并通过新的技能发现机制,使其能够在更复杂的任务和环境中实现更好的连续决策性能,实验结果表明 AdaPlanner 在 ALFWorld 和 MiniWoB++ 环境中优于现有的基线算法。
May, 2023
本文介绍了 Plansformer,这是一个进行了微调的 LLM,可用于自动化规划,并且具有强大的转移学习能力,可适用于解决不同复杂度的规划领域,其中一个 Plansformer 的配置可实现 97% 有效计划,其中 95% 为汉诺塔谜题的最优解。
Dec, 2022
本研究探讨了大型语言模型是否能够将自然语言的目标翻译成结构化的计划语言。我们使用 GPT 3.5 变种进行了实验,结果表明大型语言模型更适合进行翻译而不是规划,虽然这些模型能够利用常识知识和推理填补自然语言目标中缺失的细节,但在涉及到数字或物理推理的任务中,它们可能会出现失败,并且对所使用的提示信息很敏感。
Feb, 2023
创建基于 LLMs 的规划器(LLMPlan)与能够将文本约束转化为符号表示的符号规划器(SymPlan),通过自我反思的能力以及对自然语言中模糊约束的合并,LLM 基于规划器在 40 名用户的互动评估中表现出优异的用户满意度(70.5%)且不输于传统符号规划器(40.4%)的显式约束满足率。
Nov, 2023
通过结合状态空间搜索和基于自然语言模型的查询,我们提出了一种混合代理方法 neoplanner,以最大化状态值的上界来平衡探索和开发,并通过查询自然语言模型以生成行动计划,进一步提高了大规模状态空间和行动空间的顺序规划的性能。
Dec, 2023
提出了一种名为 DELTA 的新型 LLM 驱动的任务规划方法,通过将环境拓扑图作为 LLM 中的环境表示,以快速生成精确的规划问题描述;同时利用 LLM 将长期任务目标分解为自回归的子目标序列,以供自动化任务规划器解决;该方法提供了更高效且完全自动化的任务规划流程,实现了比现有技术更高的规划成功率和显著缩短的规划时间。
Apr, 2024
通过结合经典规划和大型语言模型的优势,我们实现了基于 LLMs 的目标分解,提高了计划的速度和执行成功,并且比单一代理计划少了更少的执行步骤,同时实现了与人类专家指定的多代理执行步骤类似的结果。
Mar, 2024