关键词stochastic multi-armed bandit problem
搜索结果 - 21
  • 流式随机多臂赌博机中的记忆 - 遗憾权衡理解
    PDFa month ago
  • 具有相似臂的图反馈贝叶斯打赏
    PDF2 months ago
  • 线性高斯动态系统产 Generated 生的不相容 Bandit 问题
    PDF2 months ago
  • HELLINGER-UCB: 一种用于随机多臂赌博问题和推荐系统冷启动问题的新算法
    PDF3 months ago
  • 数据稀缺情况下信赖区域增强的数据困局可靠决策
    PDF4 months ago
  • 多臂赌博机中的可复制性是渐进自由的
    PDF5 months ago
  • 多臂赌博机与战略代理的鲁棒和激励性算法
    PDF7 months ago
  • 一种风险厌恶的非平稳随机多臂赌博机框架
    PDF8 months ago
  • ICML具有不受限制的延迟分布的随机多臂赌博机
    PDF3 years ago
  • 恢复强盗
    PDF5 years ago
  • MM基于相关赌博机学习的快速毫米波波束对准
    PDF5 years ago
  • IJCAI多臂老虎机中聚类和历史信息的最优利用
    PDF5 years ago
  • 实现随机多臂赌博问题的公正性
    PDF5 years ago
  • MM部分揭示单位区间图上的多臂赌博机
    PDF6 years ago
  • 疟疾政策干预的新型探索技术(NETs)
    PDF7 years ago
  • 通过赌博反馈进行良好的手臂识别
    PDF7 years ago
  • 多人博弈 -- 音乐椅子方法
    PDF9 years ago
  • 差分隐私多臂赌博机算法
    PDF9 years ago
  • 有重尾巴的赌徒
    PDF12 years ago
  • 汤普森抽样:渐进最优的有限时间分析
    PDF12 years ago
Prev