Apr, 2016

分层深度强化学习:整合时间抽象和内在动机

TL;DR文章介绍了一种名为Hierarchical-DQN的框架,结合了分层的值函数、内在动机和深度强化学习,在稀疏反馈的环境中,Hierarchical-DQN可以提供灵活的目标规定和高效的探索,通过在两个问题上的实验表明该方法的有效性。