Oct, 2023
LgTS: 使用 LLM 生成的子目标进行动态任务抽样的强化学习代理
LgTS: Dynamic Task Sampling using LLM-generated sub-goals for Reinforcement Learning Agents
Yash Shukla, Wenchang Gao, Vasanth Sarathy, Alvaro Velasquez, Robert Wright...
TL;DR本研究提出了一种新方法,利用大型语言模型(LLM)的规划能力,为没有环境转换动力学访问权限的强化学习代理提供子目标的图形表示,同时最小化环境交互次数。