Jul, 2015

强化学习领域中的在线迁移学习

TL;DR本文提出了一种在线传输框架来捕捉代理之间的交互,并显示强化学习中的当前传输学习是在线传输的一种特殊情况。此外,本文将现有的代理 - 代理方法重新定位为在线传输,并分析了其中一种教学方法的三种方法。最后,还有理论结果的经验验证。