Mar, 2018

带潜在变量高斯过程的元强化学习

TL;DR利用层级潜变量模型,自动推断任务之间的关系并应用于模型强化学习中,从而实现在小规模数据集上的元学习,有效提高数据利用率,解决新任务的平均交互时间缩短高达 60%。