feature reinforcement learning | BriefGPT

关键词feature reinforcement learning

搜索结果 - 1

马尔可夫决策过程之外的极限状态聚合
研究了强化学习中的状态聚合及特征学习，通过提出基于聚合过程的马尔科夫决策过程，推广了现有的聚合结果，解决了强化学习中状态空间大小的上限问题。
PDF10 years ago