BriefGPT.xyz
Ask
alpha
关键词
planning abilities
搜索结果 - 3
用程式化警告和提示数据集评估语言模型的隐性规划技能
使用 PARADISE 数据集和任务,探讨大型语言模型在实际过程文本中推理和计划能力的强弱,发现使用任务特定的小型模型在大多数情况下效果更好,但所有模型都无法与人类表现相媲美。
PDF
4 months ago
LgTS: 使用 LLM 生成的子目标进行动态任务抽样的强化学习代理
本研究提出了一种新方法,利用大型语言模型(LLM)的规划能力,为没有环境转换动力学访问权限的强化学习代理提供子目标的图形表示,同时最小化环境交互次数。
PDF
9 months ago
SayCanPay: 基于可学习领域知识的大型语言模型的启发式规划
结合大型语言模型和启发式规划的方法,该研究提出了一种通过利用大型语言模型的世界知识和启发式搜索原则来生成行动序列的新方法,该方法能够在规划过程中考虑行动的可行性和成本效益,评估行动的长期效果,并在广泛的评估中显示优于其他大型语言模型规划方法
→
PDF
10 months ago
Prev
Next