关键词linear markov decision processes
搜索结果 - 6
- 如何扩展逆强化学习至大规模状态空间?一种经过验证的高效方法PDFa month ago
- 线性马尔可夫决策过程中的常数遗憾解决PDF3 months ago
- 面向具有悔恨的对抗性线性马尔可夫决策过程的最优化PDF9 months ago
- 稀疏线性 MDP 中的探索和学习,无需计算难解的预测器PDF10 months ago
- 线性马尔可夫决策过程中乐观近端策略优化的理论分析PDFa year ago
- 非定常线性马尔可夫决策过程中的高效学习PDF4 years ago
Prev
Next