关键词semi-bandit feedback
搜索结果 - 8
- 具有半绑定反馈的随机在线一致预测PDFa month ago
- 具有切换成本的对抗组合赌博机PDF3 months ago
- 协方差自适应最小二乘算法用于随机组合半带宽PDF4 months ago
- BORA:贝叶斯优化用于资源分配PDF2 years ago
- 组合半臂老虎机的汤普森抽样的统计效率PDF4 years ago
- 组合多臂赌博机中 Thompson Sampling 的分析与概率触发武器PDF6 years ago
- 组合半弦臂算法的一阶遗憾上界PDF9 years ago
- 一种高效的半强化反馈学习算法PDF11 years ago
Prev
Next