关键词simple regret
搜索结果 - 10
  • ICML离线强化学习中基于示例的最优订单界限与偏好反馈
    PDF18 days ago
  • 无悔的 M${}^{atural}$ 凹函数最大化:随机赌博算法和对抗完全信息设置的 NP 困难性
    PDF2 months ago
  • 通过覆盖学习因果图中的良好干预方法
    PDFa year ago
  • AAAI带汇总反馈的高斯过程赌博机
    PDF3 years ago
  • MM对于带噪声高斯过程赌博优化的损失下界
    PDF7 years ago
  • ICML精确估计线性模型的主动学习
    PDF7 years ago
  • ICML单任务和多任务优化的最小后悔搜索
    PDF8 years ago
  • ICML无限臂老虎机的简单遗憾
    PDF9 years ago
  • 用于马尔可夫决策过程在线规划的简单遗憾优化
    PDF12 years ago
  • 多臂赌博问题的纯探索
    PDF16 years ago
Prev
Next