黑暗中的规划:无专家的LLM-符号规划管道
本文介绍了 Plansformer,这是一个进行了微调的 LLM,可用于自动化规划,并且具有强大的转移学习能力,可适用于解决不同复杂度的规划领域,其中一个 Plansformer 的配置可实现 97% 有效计划,其中 95% 为汉诺塔谜题的最优解。
Dec, 2022
本研究探讨了大型语言模型是否能够将自然语言的目标翻译成结构化的计划语言。我们使用 GPT 3.5 变种进行了实验,结果表明大型语言模型更适合进行翻译而不是规划,虽然这些模型能够利用常识知识和推理填补自然语言目标中缺失的细节,但在涉及到数字或物理推理的任务中,它们可能会出现失败,并且对所使用的提示信息很敏感。
Feb, 2023
研究了通用Web语料库上训练的语言模型的计划能力,开发了基于国际计划竞赛领域的基准套件,在自治、启发式和人机协作模式下对LLM进行了评估,发现自主生成可执行计划的能力非常有限,只有约3%的成功率。
Feb, 2023
本文介绍了LLM + P框架,将经典计划器的优点结合到大语言模型中,可以通过自然语言描述解决计划问题,经过实验发现LLM + P可以提供大多数问题的最优解,而LLMs则无法为大多数问题提供甚至可行的计划。
Apr, 2023
本文旨在研究LLLms在常识规划任务中的规划能力,通过在国际计划竞赛中生成一系列实例,并评估LLMs在自主规划和启发式两种不同模式下的表现,发现LLMs在自主规划方面的表现非常有限,但在启发式模式下,LLMs生成的计划可以改善其它智能计划器的搜索过程并提供反馈以进一步验证计划质量。
May, 2023
自主规划和调度是人工智能中增长最快的领域之一,本研究通过对126篇论文进行全面检视,调查了LLMs在地址规划问题的各个方面时的独特应用,并提出了八个类别:语言翻译、计划生成、模型构建、多智能体规划、交互规划、启发式优化、工具集成以及脑启发式规划,强调LLMs与传统符号规划器的结合展示出潜力,揭示出一种有前景的神经符号化方法。
Jan, 2024
该篇论文提出了一种名为``Formal-LLM''的新型框架用于基于LLM的代理,通过结合自然语言的表现力和形式语言的准确性,使规划过程具有控制性,从而防止代理生成无效和不成功的计划,并且通过实验验证了该框架在任务性能上取得的超过50%的整体性能提升,为在规划的有效性至关重要的应用场景中更广泛地利用LLM提供了可能性。
Feb, 2024
大语言模型在规划和推理任务中的作用有很多混淆。我们认为,自回归LLM本身无法进行规划或自验证,并指出了文献中常见误解的原因。我们提出了LLM-模块化框架的愿景,将LLM的优势与外部基于模型的验证器在更紧密的双向交互方式中结合起来。我们将展示如何利用LLM获得驱动外部验证器的模型。我们还将论述LLM-模块化框架提供了更好的神经符号方法,通过更灵活的知识、问题和偏好规范,扩展了基于模型的规划/推理范围。
Feb, 2024