ICLRMay, 2024

Plan-Seq-Learn: 语言模型引导强化学习解决长时程机器人任务

TL;DR利用大型语言模型(LLMs)和运动规划,提出了一种模块化方法 Plan-Seq-Learn(PSL),将抽象语言和学习到的低级控制相结合,从头开始解决长期目标的机器人任务,并在超过 25 个具有挑战性的机器人任务中取得了最先进的结果。