关键词exploration-exploitation trade-off
搜索结果 - 30
- 贝叶斯策略优化模型不确定性PDF6 years ago
- KDDBelMan:基于置信度 - 奖励流形的贝叶斯臂选择算法PDF6 years ago
- 多路对决棍手算法及其在在线排序器评估中的应用PDF8 years ago
- AAAI具有 Lipschitz 连续奖励函数的高斯过程规划:走向统一贝叶斯优化,主动学习及其它领域PDF9 years ago
- 达尔文阅读笔记中的维多利亚科学探索与利用PDF9 years ago
- ICML神经网络中的权重不确定性PDF9 years ago
- 基于模型的贝叶斯探索PDF11 years ago
- 随机和非随机多臂赌博机问题的遗憾分析PDF12 years ago
- 对于鞅的 PAC-Bayes-Bernstein 不等式及其在多臂老虎机中的应用PDF13 years ago
- 多臂赌博问题的纯探索PDF16 years ago
Next