May, 2018

具备回顾功能的层级强化学习

TL;DR介绍一种利用通用价值函数和顺势学习相结合的方法,使代理在多个抽象层次上学习时间扩展的动作,并且在离散和连续任务中显著提高了学习效率。