关键词semi-bandit feedback
搜索结果 - 8
  • 具有半绑定反馈的随机在线一致预测
    PDFa month ago
  • 具有切换成本的对抗组合赌博机
    PDF3 months ago
  • 协方差自适应最小二乘算法用于随机组合半带宽
    PDF4 months ago
  • BORA:贝叶斯优化用于资源分配
    PDF2 years ago
  • 组合半臂老虎机的汤普森抽样的统计效率
    PDF4 years ago
  • 组合多臂赌博机中 Thompson Sampling 的分析与概率触发武器
    PDF6 years ago
  • 组合半弦臂算法的一阶遗憾上界
    PDF9 years ago
  • 一种高效的半强化反馈学习算法
    PDF11 years ago
Prev
Next