利用最大多样性微调解锁大型语言模型的规划能力

Jun, 2024

利用最大多样性微调解锁大型语言模型的规划能力

Unlocking Large Language Model's Planning Capabilities with Maximum Diversity Fine-tuning

Wenjun Li, Changyu Chen, Pradeep Varakantham

TL;DR大型语言模型 (LLMs) 具有令人印象深刻的任务解决能力，通过提示技术或系统设计实现。然而，在规划任务方面，对它们的熟练度引发了一些关注，因为它们常常难以生成有效的计划。本文研究了精调对LLMs规划能力的影响。我们的发现表明，通过大规模精调 (数千个具体示例)，LLMs可以在规划中获得良好的性能。然而，精调伴随着显著的经济和计算成本。为了解决这一挑战，我们提出了最大多样性精调 (MDFT) 策略，以改进规划领域中精调的样本效率。具体地，我们的算法 (MDFT-g) 通过使用图形表示对规划任务实例进行编码，并在向量空间中选择一组样本，以最大化数据的多样性。我们通过实验证明，MDFT-g 在多个基准领域的各种规模上始终优于现有的基准。

Abstract

large language models (LLMs) have demonstrated impressive task-solving capabilities, achieved through either prompting techniques or system designs. However, concerns have arisen regarding their proficiency in planning tasks, as they often struggle to generate valid plans. This paper i

发现论文，激发创造

利用大语言模型将自然语言转换为计划目标

本研究探讨了大型语言模型是否能够将自然语言的目标翻译成结构化的计划语言。我们使用 GPT 3.5 变种进行了实验，结果表明大型语言模型更适合进行翻译而不是规划，虽然这些模型能够利用常识知识和推理填补自然语言目标中缺失的细节，但在涉及到数字或物理推理的任务中，它们可能会出现失败，并且对所使用的提示信息很敏感。

Feb, 2023

LLM+P：利用最优规划提升大型语言模型的性能

本文介绍了LLM + P框架，将经典计划器的优点结合到大语言模型中，可以通过自然语言描述解决计划问题，经过实验发现LLM + P可以提供大多数问题的最优解，而LLMs则无法为大多数问题提供甚至可行的计划。

Apr, 2023

利用预训练的大型语言模型构建和利用世界模型进行基于模型的任务规划

本研究引入了一种新的方法，使用 PDDL 语言构建显式世界模型，并利用预训练的大型语言模型作为 PDDL 和校验器等纠正反馈的接口，以提高计划问题的效率和准确性。在不涉及用户互动的情况下，通过验证 PDDL 模型的正确性，我们制定计划来解决复杂任务并取得成功。

May, 2023

理解大型语言模型在自动化规划方面的能力

该研究旨在探讨大型语言模型在自动计划中的应用，研究包括使用何种预训练数据最有效、微调或提示哪种方法最有效以及大型语言模型能否进行计划综合。

May, 2023

关于大语言模型的规划、搜索和记忆能力

通过对GPT-4在规划子领域中的表现进行全面检查，我们鉴定了大型语言模型在解决规划问题方面的优势和限制，并提出了改进领域特定大型语言模型的思维链能力的方法。这些结果为大语言模型在规划领域的潜在应用提供了宝贵的见解，并为未来的研究克服其限制和拓展其能力铺平了道路。

Sep, 2023

Tree-Planner：基于大型语言模型的高效闭环任务规划

通过分解LLM查询为单个计划采样调用和多个实时环境决策调用，Tree-Planner实现了先进的性能并保持高效率。

Oct, 2023

关于将大型语言模型（LLMs）纳入自动规划和调度（APS）的前景展望

自主规划和调度是人工智能中增长最快的领域之一，本研究通过对126篇论文进行全面检视，调查了LLMs在地址规划问题的各个方面时的独特应用，并提出了八个类别：语言翻译、计划生成、模型构建、多智能体规划、交互规划、启发式优化、工具集成以及脑启发式规划，强调LLMs与传统符号规划器的结合展示出潜力，揭示出一种有前景的神经符号化方法。

Jan, 2024

探索和基准测试大型语言模型的规划能力

提高大型语言模型的规划能力，研究领域包括基于上下文学习、微调，以及在未知领域的性能评估。

Jun, 2024

从基础到突破的最终指南：大型语言模型微调的全面技术、研究、最佳实践、应用研究挑战与机遇综述

本报告探讨了大型语言模型（LLMs）的微调，结合理论见解与实践应用，填补了传统自然语言处理（NLP）模型到AI关键角色之间的研究空白。报告引入了一个结构化的七阶段微调流程，并强调管理不平衡数据集和优化技术。显著发现是采用高效参数方法能够在计算效率和性能之间取得良好平衡，报告为研究者和从业者提供了实用的见解。

Aug, 2024

自然语言规划改善大语言模型代码生成的搜索能力

本研究针对大语言模型（LLMs）在推理计算中缺乏多样性所导致的低效搜索问题进行了探讨。通过提出PLANSEARCH这一新颖的搜索算法，研究表明基于自然语言的计划搜索能产生更为多样化的解决方案，从而显著提升了代码生成的效果，特别是在LiveCodeBench上达到了77.0%的最佳通过率。

Sep, 2024