关键词whittle index
搜索结果 - 6
  • 一种基于指标的无休止赌博任务分配策略:为拉动机械臂工人争取公平
    PDFa year ago
  • DeepTOP: MDP 和 RMAB 的深度阈值最优策略
    PDF2 years ago
  • 有限时间和流式无休止多臂赌博机问题的高效算法
    PDF3 years ago
  • 折叠赌博算法及其在公共卫生干预中的应用
    PDF4 years ago
  • 基于 Whittle 指数的平均奖励不安匪徒问题的 Q 学习
    PDF4 years ago
  • 以不安静强盗策略为特点的机会调度
    PDF7 years ago
Prev
Next