Mar, 2018
利用后继表示加速建构性预测框架的学习
Accelerating Learning in Constructive Predictive Frameworks with the Successor Representation
Craig Sherstan, Marlos C. Machado, Patrick M. Pilarski
TL;DR本文研究使用后继表示法(SR)加速基于通用价值函数(GVF)的积极知识系统的学习,在网格世界中分析了该方法,并在机器人物理数据上证明了它的潜力。