关键词approximate policy iteration
搜索结果 - 6
  • 正式验证的近似策略迭代
    PDF25 days ago
  • 在 q^π 可实现的 MDPs 中进行自信近似策略迭代,以实现高效的本地规划
    PDF2 years ago
  • 使用双仿度量进行近似策略迭代
    PDF2 years ago
  • 政策优化的贪婪算子:研究正向和反向 KL 散度
    PDF3 years ago
  • 双策略迭代
    PDF6 years ago
  • 带政策语言偏差的近似策略迭代:解决关系马尔可夫决策过程
    PDF13 years ago
Prev
Next