Mar, 2021

ELLA: 通过学习语言抽象进行探索

TL;DRELLA是一种基于奖励塑形的方法,在语言指令与简单低级组成件之间建立相关性,以提高稀疏奖励环境下机器人智能体的样本效率。