关键词upper confidence bound
搜索结果 - 37
  • 最小化 UCB:局部贝叶斯优化中更好的局部搜索策略
    PDFa month ago
  • 基于 UCB 驱动的多目标增强学习的效用函数搜索
    PDF2 months ago
  • 蒙特卡洛树搜索与 Boltzmann 探索
    PDF3 months ago
  • 上下文多臂赌博机的树集成
    PDF5 months ago
  • 合作多智体图形赌博机:UCB 算法和遗憾分析
    PDF6 months ago
  • 通过广义加权平均对上置信界算法进行简单修改
    PDF10 months ago
  • REX:AI 代理的快速探索与利用
    PDFa year ago
  • 可证明有效的 UCB 类算法用于学习预测状态表示
    PDFa year ago
  • 具有不对称置信区间的预算多臂赌博机
    PDFa year ago
  • 量子计算在情节式强化学习中提供指数级的遗憾改善
    PDFa year ago
  • 递归优化等效性下的马尔科夫决策过程遗憾界限
    PDFa year ago
  • AAAI分散式随机多人多臂行走赌博机
    PDF2 years ago
  • AAAI层次专家赌博问题的遗憾分析
    PDF2 years ago
  • KDD带有臂组图的神经赌博机
    PDF2 years ago
  • AAAI乐观 Whittle 指数策略:动态赌博机的在线学习
    PDF2 years ago
  • IJCAI匹配市场中的赌博学习的汤普森抽样
    PDF2 years ago
  • AAAI多项式 Logit 上下文强化学习:可证优化与实用性
    PDF3 years ago
  • 个性化联邦多臂老虎机
    PDF3 years ago
  • 具有深度表示和浅层探索的神经背景医师
    PDF4 years ago
  • 成本补贴的多臂老虎机
    PDF4 years ago
Prev