BriefGPT.xyz
Ask
alpha
关键词
non-markov decision process
搜索结果 - 3
从只包含状态序列中学习非 Markov 决策制定
本文研究了一种在非 Markov 决策过程下进行深度生成建模的模型,在无法观察到动作的情况下进行模仿学习和决策制定。
PDF
a year ago
使用蒙特卡罗树搜索的策略梯度算法用于非马尔可夫决策过程
本文介绍一种结合 Policy Gradient 和 Monte-Carlo Tree Search 的混合策略,旨在克服两种方法在应对非马尔可夫决策过程上的困难,有效提升算法的效率。
PDF
2 years ago
IJCAI
常规决策过程中高效的 PAC 强化学习
本文探讨了如何在正则决策流程中实现强化学习,并提出了在一组参数中可以 PAC - 学习这一流程的最优策略。
PDF
3 years ago
Prev
Next