BriefGPT.xyz
Ask
alpha
关键词
feature-based aggregation
搜索结果 - 1
基于特征聚合和深度强化学习的调查与一些新实现
本文介绍了针对有限状态折扣马尔可夫决策问题的近似解法 - 政策迭代方法,重点关注基于特征聚合的方法以及它们与深度强化学习方案的关系。本文提出了原问题状态的特征并且制定了一个更小的 “聚合” 的马尔可夫决策问题,其状态与特征相关。我们讨论了这
→
PDF
6 years ago
Prev
Next