关键词linear markov decision processes
搜索结果 - 6
  • 如何扩展逆强化学习至大规模状态空间?一种经过验证的高效方法
    PDFa month ago
  • 线性马尔可夫决策过程中的常数遗憾解决
    PDF3 months ago
  • 面向具有悔恨的对抗性线性马尔可夫决策过程的最优化
    PDF9 months ago
  • 稀疏线性 MDP 中的探索和学习,无需计算难解的预测器
    PDF10 months ago
  • 线性马尔可夫决策过程中乐观近端策略优化的理论分析
    PDFa year ago
  • 非定常线性马尔可夫决策过程中的高效学习
    PDF4 years ago
Prev
Next