关键词exploration-exploitation tradeoff
搜索结果 - 12
  • 基于贝叶斯激励相容性的双边市场动态在线推荐
    PDFa month ago
  • 自适应探索的近端策略优化
    PDF2 months ago
  • 进化计算中基于深度强化学习的自动配置探索 - 开发平衡
    PDF3 months ago
  • 在线 MNL 选择下的联合搭配与库存优化
    PDFa year ago
  • 安全覆盖控制的近似最优多智能体学习
    PDF2 years ago
  • 批次神经赌博机
    PDF3 years ago
  • KDD朝向深度监督异常检测:从部分标记异常数据中强化学习
    PDF4 years ago
  • ICLR强化学习与概率推断的理解
    PDF5 years ago
  • ICML探索感知强化学习再探
    PDF6 years ago
  • ICML机会主义赌博机的自适应勘探和开发平衡
    PDF7 years ago
  • 具有凹奖励和凸背包的赌博机
    PDF10 years ago
  • ICML多臂赌博机中的探索与利用分离
    PDF12 years ago
Prev
Next