关键词optimistic algorithm
搜索结果 - 6
  • 线性 MDPs 中具有累积赌臂反馈的近最优遗憾
    PDF2 months ago
  • 广义线性赌博机中的延迟反馈:重访
    PDF2 years ago
  • ICML改进后的逻辑回归赌博机算法
    PDF4 years ago
  • 非平稳环境下的加权线性赌博机
    PDF5 years ago
  • 通过马尔可夫链浓度推导强化学习的遗憾界
    PDF6 years ago
  • 半强化反馈下的最优资源分配
    PDF10 years ago
Prev
Next