关键词optimism principle
搜索结果 - 6
  • ICLR基于模型的因果贝叶斯优化
    PDF2 years ago
  • 使用通用价值函数逼近进行强化学习中的随机探索
    PDF3 years ago
  • 使用线性函数逼近学习无限时间平均回报马尔可夫决策过程
    PDF4 years ago
  • 基于模型的强化学习与价值目标回归
    PDF4 years ago
  • 线性上下文臂优化中的自适应探索
    PDF5 years ago
  • 乐观主义的终结?有限臂线性赌博机的渐近分析
    PDF8 years ago
Prev
Next