使用大型语言模型生成一致的 PDDL 领域
本研究引入了一种新的方法,使用 PDDL 语言构建显式世界模型,并利用预训练的大型语言模型作为 PDDL 和校验器等纠正反馈的接口,以提高计划问题的效率和准确性。在不涉及用户互动的情况下,通过验证 PDDL 模型的正确性,我们制定计划来解决复杂任务并取得成功。
May, 2023
通过使用大型语言模型 (LLMs) 生成并优化机器人任务计划,该研究提出了一种创新方法,解决了 LLMs 输出中潜在的不确定性和错误步骤的问题,进而改善了计划的准确性和执行效率。
Jan, 2024
NL2Plan 是第一个通用领域脱机驱动计划系统,利用大型语言模型通过逐步提取必要信息从短文本提示创建完整的 PDDL 描述,进而通过经典计划器解决问题,提供解决 15 个任务中 10 个任务的改进以及提高可解释性和 PDDL 创建协助工具的功能。
May, 2024
提出使用经典规划和大型语言模型共同实施领域归纳、学习和验证动作的前后条件,利用 LLM 推理来启发性地完成经典规划器发出的部分计划,并根据执行后的环境反馈用逻辑语言推断领域的语义规则。通过对 7 个环境的分析表明,使用 LLMs 作为启发性规划器和规则预测器仅需一个专家精心策划的示例计划,就能够比随机探索更少的执行步骤和环境重置,并同时恢复领域的基本行动语义。
Jun, 2024
通过结合经典规划和大型语言模型的优势,我们实现了基于 LLMs 的目标分解,提高了计划的速度和执行成功,并且比单一代理计划少了更少的执行步骤,同时实现了与人类专家指定的多代理执行步骤类似的结果。
Mar, 2024
本研究考察了大型语言模型是否可作为广义规划器,提供域和训练任务后,生成一个能够有效产生其他任务规划的程序。实验使用 PDDL 领域和 GPT-4 来合成 Python 程序,并考虑了 CoT 摘要和自动调试。研究发现,GPT-4 是一个出乎意料的功能强大的广义规划器,且自动调试非常重要,而 CoT 摘要影响不均。
May, 2023
在全面自主的机器人系统领域,本研究通过提出系统架构来解决复杂开放世界环境中任务与动作规划的挑战,核心是处理生成计划中的物理、逻辑和语义错误的重规划策略。通过在仿真和两个复杂的现实场景中进行实证评估,我们展示了所提出的反馈架构对可执行性、正确性和时间复杂性的有效性。
Oct, 2023
本研究探讨了大型语言模型是否能够将自然语言的目标翻译成结构化的计划语言。我们使用 GPT 3.5 变种进行了实验,结果表明大型语言模型更适合进行翻译而不是规划,虽然这些模型能够利用常识知识和推理填补自然语言目标中缺失的细节,但在涉及到数字或物理推理的任务中,它们可能会出现失败,并且对所使用的提示信息很敏感。
Feb, 2023
最近大型语言模型(LLMs)的可用性推动了许多基于 LLM 的方法的发展,旨在提供各种最终用户任务的自然语言接口。我们提出的方法的关键思想是利用逻辑推理和经典人工智能规划,结合 LLM 准确回答用户查询,包括识别和收集这些查询中的任何缺失信息。
May, 2024