Jan, 2024

GLIDE-RL: 基于强化学习的通过演示进行语言指导

TL;DR通过多个教师 - 学生代理的课程学习框架,GLIDE-RL 提出了一种训练自然语言指令遵循的强化学习代理的新算法,通过利用强化学习、课程学习、连续学习和语言模型的进展,能够适应以前未见过的语言指令并验证了其有效性。