BriefGPT.xyz
大模型
Ask
alpha
关键词
feature reinforcement learning
搜索结果 - 1
马尔可夫决策过程之外的极限状态聚合
研究了强化学习中的状态聚合及特征学习,通过提出基于聚合过程的马尔科夫决策过程,推广了现有的聚合结果,解决了强化学习中状态空间大小的上限问题。
PDF
10 years ago
Prev
Next