以人为中心的规划
基于最近的研究,我们通过实验表明,大语言模型(LLMs) 缺乏规划所需的必要技能。基于这些观察,我们提倡将 LLMs 与经典规划方法相结合的混合方法的潜力。然后,我们引入了一种新颖的混合方法 SimPlan,并在一个新的具有挑战性的环境中评估其性能。我们在各种规划领域进行了大量实验,结果表明 SimPlan 明显优于现有的基于 LLMs 的规划器。
Feb, 2024
研究了通用 Web 语料库上训练的语言模型的计划能力,开发了基于国际计划竞赛领域的基准套件,在自治、启发式和人机协作模式下对 LLM 进行了评估,发现自主生成可执行计划的能力非常有限,只有约 3% 的成功率。
Feb, 2023
自主规划和调度是人工智能中增长最快的领域之一,本研究通过对 126 篇论文进行全面检视,调查了 LLMs 在地址规划问题的各个方面时的独特应用,并提出了八个类别:语言翻译、计划生成、模型构建、多智能体规划、交互规划、启发式优化、工具集成以及脑启发式规划,强调 LLMs 与传统符号规划器的结合展示出潜力,揭示出一种有前景的神经符号化方法。
Jan, 2024
本文旨在研究 LLLms 在常识规划任务中的规划能力,通过在国际计划竞赛中生成一系列实例,并评估 LLMs 在自主规划和启发式两种不同模式下的表现,发现 LLMs 在自主规划方面的表现非常有限,但在启发式模式下,LLMs 生成的计划可以改善其它智能计划器的搜索过程并提供反馈以进一步验证计划质量。
May, 2023
通过对大型语言模型(LLMs)嵌入已知的规划框架中的研究,我们展示了在各种规划领域中,这种新型基于 LLMs 的规划框架的有效性。
Feb, 2024
大语言模型在规划和推理任务中的作用有很多混淆。我们认为,自回归 LLM 本身无法进行规划或自验证,并指出了文献中常见误解的原因。我们提出了 LLM - 模块化框架的愿景,将 LLM 的优势与外部基于模型的验证器在更紧密的双向交互方式中结合起来。我们将展示如何利用 LLM 获得驱动外部验证器的模型。我们还将论述 LLM - 模块化框架提供了更好的神经符号方法,通过更灵活的知识、问题和偏好规范,扩展了基于模型的规划 / 推理范围。
Feb, 2024
将大型语言模型作为自主代理的规划模块,通过提供现有作品的分类和全面分析,讨论了任务分解、计划选择和外部模块等方向在 LLM-Agent 规划中的进展和挑战。
Feb, 2024
本文介绍了 Plansformer,这是一个进行了微调的 LLM,可用于自动化规划,并且具有强大的转移学习能力,可适用于解决不同复杂度的规划领域,其中一个 Plansformer 的配置可实现 97% 有效计划,其中 95% 为汉诺塔谜题的最优解。
Dec, 2022
本文介绍了 LLM + P 框架,将经典计划器的优点结合到大语言模型中,可以通过自然语言描述解决计划问题,经过实验发现 LLM + P 可以提供大多数问题的最优解,而 LLMs 则无法为大多数问题提供甚至可行的计划。
Apr, 2023