关键词bayesian regret
搜索结果 - 12
- 在线强盗学习伴随离线偏好数据PDF23 days ago
- 线性强化学习问题的信息论界限和紧凑遗憾率PDF4 months ago
- 基于信息论的噪声上下文随机赌博机的汤普森抽样算法的遗憾分析PDF6 months ago
- 利用后验抽样开发因果图先验的强化学习PDF9 months ago
- 离线赌博机中基于贝叶斯遗憾最小化的凸松弛方法PDFa year ago
- 镜像下降和信息比率PDF4 years ago
- 分布稳健的贝叶斯积分优化PDF4 years ago
- Thompson 采样在逻辑回归老虎机问题中的表现PDF5 years ago
- 基于信息论的部分监控极小后悔策略PDF5 years ago
- 基于 Thompson Sampling 的未知线性系统学习控制PDF7 years ago
- 带图反馈的随机赌博机的汤普森抽样PDF7 years ago
- Thompson 抽样的无先验和有先验依赖的遗憾界PDF11 years ago
Prev
Next