关键词approximate policy iteration
搜索结果 - 6
- 正式验证的近似策略迭代PDF25 days ago
- 在 q^π 可实现的 MDPs 中进行自信近似策略迭代,以实现高效的本地规划PDF2 years ago
- 使用双仿度量进行近似策略迭代PDF2 years ago
- 政策优化的贪婪算子:研究正向和反向 KL 散度PDF3 years ago
- 双策略迭代PDF6 years ago
- 带政策语言偏差的近似策略迭代:解决关系马尔可夫决策过程PDF13 years ago
Prev
Next