关键词simple regret
搜索结果 - 10
- ICML离线强化学习中基于示例的最优订单界限与偏好反馈PDF18 days ago
- 无悔的 M${}^{atural}$ 凹函数最大化:随机赌博算法和对抗完全信息设置的 NP 困难性PDF2 months ago
- 通过覆盖学习因果图中的良好干预方法PDFa year ago
- AAAI带汇总反馈的高斯过程赌博机PDF3 years ago
- MM对于带噪声高斯过程赌博优化的损失下界PDF7 years ago
- ICML精确估计线性模型的主动学习PDF7 years ago
- ICML单任务和多任务优化的最小后悔搜索PDF8 years ago
- ICML无限臂老虎机的简单遗憾PDF9 years ago
- 用于马尔可夫决策过程在线规划的简单遗憾优化PDF12 years ago
- 多臂赌博问题的纯探索PDF16 years ago
Prev
Next