Nov, 2023

LLM 增强分层代理

TL;DR利用强化学习解决长期和拓展性任务很具挑战性,特别是在没有先验知识的情况下,为了提高样本效率,本文通过利用 LLMs 的规划能力结合强化学习的环境学习,构建了一个层次化代理,用于解决长期任务,并在 MiniGrid、SkillHack 和 Crafter 等仿真环境以及实际机械臂的块操作任务中验证了该方法的优越性能,且训练完成后不需要依赖 LLMs 进行部署。