May, 2024

带有世界知识模型的 Agent 规划

TL;DR使用大型语言模型作为代理模型来执行交互式规划任务已取得令人称赞的结果。本文引入了参数化的世界知识模型(WKM)来促进代理规划,通过从专家和采样轨迹中自我合成知识,并提供全局任务知识和动态状态知识来指导全局规划和辅助局部规划。实验证明我们的方法在复杂的真实世界模拟数据集上相比强基线能够取得优越性能,减轻了盲目试错和幻觉行为问题,为代理对世界的理解提供了有力支持,同时表明了 WKM 具有更好的泛化性能、弱 WKM 能指导强代理模型的规划,并且统一的 WKM 训练具有进一步发展的潜力。