ICLRMay, 2024
Plan-Seq-Learn: 语言模型引导强化学习解决长时程机器人任务
Plan-Seq-Learn: Language Model Guided RL for Solving Long Horizon Robotics Tasks
Murtaza Dalal, Tarun Chiruvolu, Devendra Chaplot, Ruslan Salakhutdinov
TL;DR利用大型语言模型(LLMs)和运动规划,提出了一种模块化方法 Plan-Seq-Learn(PSL),将抽象语言和学习到的低级控制相结合,从头开始解决长期目标的机器人任务,并在超过 25 个具有挑战性的机器人任务中取得了最先进的结果。