关键词exploration-exploitation trade-off
搜索结果 - 30
  • 贝叶斯策略优化模型不确定性
    PDF6 years ago
  • KDDBelMan:基于置信度 - 奖励流形的贝叶斯臂选择算法
    PDF6 years ago
  • 多路对决棍手算法及其在在线排序器评估中的应用
    PDF8 years ago
  • AAAI具有 Lipschitz 连续奖励函数的高斯过程规划:走向统一贝叶斯优化,主动学习及其它领域
    PDF9 years ago
  • 达尔文阅读笔记中的维多利亚科学探索与利用
    PDF9 years ago
  • ICML神经网络中的权重不确定性
    PDF9 years ago
  • 基于模型的贝叶斯探索
    PDF11 years ago
  • 随机和非随机多臂赌博机问题的遗憾分析
    PDF12 years ago
  • 对于鞅的 PAC-Bayes-Bernstein 不等式及其在多臂老虎机中的应用
    PDF13 years ago
  • 多臂赌博问题的纯探索
    PDF16 years ago
Next