关键词mdp
搜索结果 - 48
  • ICML强化学习中发现和消除外生状态变量和奖励
    PDF6 years ago
  • 结构化强化学习的探索
    PDF6 years ago
  • 马尔可夫决策过程之外的极限状态聚合
    PDF10 years ago
  • 强化学习中的状态表示选择
    PDF11 years ago
  • 基于 MDP 的推荐系统
    PDF12 years ago
  • 序贯决策环境中的动态教学
    PDF12 years ago
  • 使用线性回归探索紧凑的强化学习表示
    PDF12 years ago
  • 基于方差的奖励函数用于近似贝叶斯强化学习
    PDF12 years ago
Next