Jul, 2014

马尔可夫决策过程之外的极限状态聚合

TL;DR研究了强化学习中的状态聚合及特征学习,通过提出基于聚合过程的马尔科夫决策过程,推广了现有的聚合结果,解决了强化学习中状态空间大小的上限问题。