关键词exploration-exploitation
搜索结果 - 11
  • ICML基于表示的强化学习
    PDFa year ago
  • 贝叶斯优化中探索 - 利用权衡的掌握
    PDFa year ago
  • AAAI基于模型的强化学习与多项式逻辑函数逼近
    PDF2 years ago
  • 广义数据分布迭代
    PDF2 years ago
  • KDD深度点击率预测的对抗梯度驱动探索
    PDF3 years ago
  • KDD基于置信上界的关系型赌博机知识注入策略梯度
    PDF3 years ago
  • AAAI多智能体学习中的勘探与开发:灾变理论与博弈论相遇
    PDF4 years ago
  • 使用经验伯恩斯坦不等式对 UCRL2 算法进行改进分析
    PDF4 years ago
  • 非通信马尔可夫决策过程中的近最优探索利用
    PDF6 years ago
  • ICML在线集群化的赌博机
    PDF10 years ago
  • 通过后验抽样学习优化
    PDF11 years ago
Prev
Next