使用大型语言模型生成一致的 PDDL 领域

Apr, 2024

使用大型语言模型生成一致的 PDDL 领域

Generating consistent PDDL domains with Large Language Models

Pavel Smirnov, Frank Joublin, Antonello Ceravola, Michael Gienger

TL;DR用自动一致性检查策略显著改善由大型语言模型生成的 PDDL 模型的质量，并减少后续纠正工作的人力投入。

Abstract

large language models (LLMs) are capable of transforming natural language domain descriptions into plausibly looking pddl markup. However, ensuring that actions are consistent within domains still remains a chall

large language models pddl markup consistency checking llm-generated models error detection

发现论文，激发创造

大型语言模型作为规划领域生成器

通过对 7 个大型语言模型进行实证分析，我们发现大型语言模型在从自然语言描述中生成正确的规划领域模型方面具有适中的能力。

Apr, 2024

利用预训练的大型语言模型构建和利用世界模型进行基于模型的任务规划

本研究引入了一种新的方法，使用 PDDL 语言构建显式世界模型，并利用预训练的大型语言模型作为 PDDL 和校验器等纠正反馈的接口，以提高计划问题的效率和准确性。在不涉及用户互动的情况下，通过验证 PDDL 模型的正确性，我们制定计划来解决复杂任务并取得成功。

May, 2023

利用大型语言模型生成的机器人计划树的整合以提高可靠性

通过使用大型语言模型 (LLMs) 生成并优化机器人任务计划，该研究提出了一种创新方法，解决了 LLMs 输出中潜在的不确定性和错误步骤的问题，进而改善了计划的准确性和执行效率。

Jan, 2024

NL2Plan: 从最简文本描述中驱动的鲁棒性 LLM 规划

NL2Plan 是第一个通用领域脱机驱动计划系统，利用大型语言模型通过逐步提取必要信息从短文本提示创建完整的 PDDL 描述，进而通过经典计划器解决问题，提供解决 15 个任务中 10 个任务的改进以及提高可解释性和 PDDL 创建协助工具的功能。

May, 2024

语言模型可以从环境反馈中推断经典计划器的动作语义

提出使用经典规划和大型语言模型共同实施领域归纳、学习和验证动作的前后条件，利用 LLM 推理来启发性地完成经典规划器发出的部分计划，并根据执行后的环境反馈用逻辑语言推断领域的语义规则。通过对 7 个环境的分析表明，使用 LLMs 作为启发性规划器和规则预测器仅需一个专家精心策划的示例计划，就能够比随机探索更少的执行步骤和环境重置，并同时恢复领域的基本行动语义。

Jun, 2024

TwoStep：基于经典规划器和大型语言模型的多智能体任务规划

通过结合经典规划和大型语言模型的优势，我们实现了基于 LLMs 的目标分解，提高了计划的速度和执行成功，并且比单一代理计划少了更少的执行步骤，同时实现了与人类专家指定的多代理执行步骤类似的结果。

Mar, 2024

使用预训练大型语言模型进行 PDDL 领域的广义规划

本研究考察了大型语言模型是否可作为广义规划器，提供域和训练任务后，生成一个能够有效产生其他任务规划的程序。实验使用 PDDL 领域和 GPT-4 来合成 Python 程序，并考虑了 CoT 摘要和自动调试。研究发现，GPT-4 是一个出乎意料的功能强大的广义规划器，且自动调试非常重要，而 CoT 摘要影响不均。

May, 2023

CoPAL: 机器人动作的修正规划与大型语言模型

在全面自主的机器人系统领域，本研究通过提出系统架构来解决复杂开放世界环境中任务与动作规划的挑战，核心是处理生成计划中的物理、逻辑和语义错误的重规划策略。通过在仿真和两个复杂的现实场景中进行实证评估，我们展示了所提出的反馈架构对可执行性、正确性和时间复杂性的有效性。

Oct, 2023

利用大语言模型将自然语言转换为计划目标

本研究探讨了大型语言模型是否能够将自然语言的目标翻译成结构化的计划语言。我们使用 GPT 3.5 变种进行了实验，结果表明大型语言模型更适合进行翻译而不是规划，虽然这些模型能够利用常识知识和推理填补自然语言目标中缺失的细节，但在涉及到数字或物理推理的任务中，它们可能会出现失败，并且对所使用的提示信息很敏感。

Feb, 2023

支持不完整用户查询的 LLM + 推理 + 规划在 API 存在的情况下

最近大型语言模型（LLMs）的可用性推动了许多基于 LLM 的方法的发展，旨在提供各种最终用户任务的自然语言接口。我们提出的方法的关键思想是利用逻辑推理和经典人工智能规划，结合 LLM 准确回答用户查询，包括识别和收集这些查询中的任何缺失信息。

May, 2024