关键词upper confidence bounds
搜索结果 - 7
  • 基于数据驱动的上界置信度在重尾赌博机上的近优遗憾
    PDFa month ago
  • 潜在赌徒问题的再探讨
    PDF4 years ago
  • 多臂赌博机问题:一种有效的非参数解决方案
    PDF7 years ago
  • 带图反馈的随机赌博机的汤普森抽样
    PDF7 years ago
  • 无折扣连续强化学习的在线遗憾界
    PDF11 years ago
  • 利用随机赌博机的侧观察优化
    PDF12 years ago
  • 随机多臂赌博问题的遗憾下界和拓展上置信界策略
    PDF13 years ago
Prev
Next