关键词multi-armed bandit problems
搜索结果 - 15
  • 用于赌博游戏的近似信息最大化
    PDF9 months ago
  • 高效勘探 - 开发策略的近似信息
    PDFa year ago
  • ICML嵌套赌博机
    PDF2 years ago
  • MOTS:极小极大化优化的汤普森采样
    PDF4 years ago
  • 鉴别好臂之真实样本复杂性
    PDF5 years ago
  • 针对具有无限奖励的多臂赌博机的分布式无感知、风险感知算法
    PDF5 years ago
  • 无图形图形赌博机 Thompson 抽样的分析
    PDF6 years ago
  • 风险规避的均值方差多臂赌博机问题
    PDF8 years ago
  • 探索先行,利用随后:强盗问题中后悔的真实形状
    PDF8 years ago
  • 多臂老虎机模型在临床试验最优设计中的应用:优势与挑战
    PDF9 years ago
  • NIPS一伙强盗
    PDF11 years ago
  • 进一步优化 Thompson Sampling 算法的后悔上界
    PDF12 years ago
  • 探索 / 开发策略的元学习:多臂赌博机案例
    PDF12 years ago
  • 随机和非随机多臂赌博机问题的遗憾分析
    PDF12 years ago
  • 非平稳赌博机问题的置信上限策略
    PDF16 years ago
Prev
Next