Dec, 2022

通过压缩学习选项

TL;DR研究多任务强化学习中的统计规律对于新任务学习的加速是有效的,而技能学习是实现这一目标的一种方式,技能学习的热门方法是使用潜在变量模型来最大化预收集的经验的可能性,结合应用于描述技能的描述长度惩罚的新目标可以使技能更好地从经验中提取共同结构,并在具有高维图像观察的挑战性任务中进行了验证。