关键词bayesian regret
搜索结果 - 12
  • 在线强盗学习伴随离线偏好数据
    PDF23 days ago
  • 线性强化学习问题的信息论界限和紧凑遗憾率
    PDF4 months ago
  • 基于信息论的噪声上下文随机赌博机的汤普森抽样算法的遗憾分析
    PDF6 months ago
  • 利用后验抽样开发因果图先验的强化学习
    PDF9 months ago
  • 离线赌博机中基于贝叶斯遗憾最小化的凸松弛方法
    PDFa year ago
  • 镜像下降和信息比率
    PDF4 years ago
  • 分布稳健的贝叶斯积分优化
    PDF4 years ago
  • Thompson 采样在逻辑回归老虎机问题中的表现
    PDF5 years ago
  • 基于信息论的部分监控极小后悔策略
    PDF5 years ago
  • 基于 Thompson Sampling 的未知线性系统学习控制
    PDF7 years ago
  • 带图反馈的随机赌博机的汤普森抽样
    PDF7 years ago
  • Thompson 抽样的无先验和有先验依赖的遗憾界
    PDF11 years ago
Prev
Next