Mar, 2018

利用后继表示加速建构性预测框架的学习

TL;DR本文研究使用后继表示法(SR)加速基于通用价值函数(GVF)的积极知识系统的学习,在网格世界中分析了该方法,并在机器人物理数据上证明了它的潜力。