Oct, 2023

LgTS: 使用 LLM 生成的子目标进行动态任务抽样的强化学习代理

TL;DR本研究提出了一种新方法,利用大型语言模型(LLM)的规划能力,为没有环境转换动力学访问权限的强化学习代理提供子目标的图形表示,同时最小化环境交互次数。