关键词exploration-exploitation trade-off
搜索结果 - 30
  • 概率演员 - 评论家:利用 PAC-Bayes 不确定性学习探索
    PDF5 months ago
  • 多臂赌博机策略对深度循环强化学习的影响
    PDF9 months ago
  • 学习通过选项框架整合强化学习的探索策略
    PDF9 months ago
  • 强化学习中的扩散过程奖励塑造
    PDFa year ago
  • 自适应加权期望提升贝叶斯优化
    PDFa year ago
  • 预测算法故障模式高效识别
    PDFa year ago
  • 贝叶斯分层建模下主动学习回归的动态探索和利用权衡
    PDFa year ago
  • 具有对数最坏情况遗憾的量子强化学习的可证明高效探索
    PDFa year ago
  • 基于邻近状态的强化学习探索
    PDF2 years ago
  • MEET: 一种用于缓冲区采样的 Monte Carlo 探索 - 利用权衡算法
    PDF2 years ago
  • 机遇性偶发式强化学习
    PDF2 years ago
  • IJCAI风险感知多臂老虎机调查
    PDF2 years ago
  • BADDr: 基于贝叶斯适应性的深度 Dropout RL 用于 POMDPs
    PDF2 years ago
  • 通过离线神谕在具有多个类别的情境下选择最优模型的方法
    PDF3 years ago
  • ICML学习针对移动目标进行定价
    PDF3 years ago
  • 一种可证明有效的强化学习样本采集策略
    PDF4 years ago
  • MM多样性策略梯度用于高效样本质量多样化优化
    PDF4 years ago
  • IJCAI随机高斯过程上置信区间的贝叶斯优化
    PDF4 years ago
  • IJCAI蒙特卡罗树搜索用于策略优化
    PDF5 years ago
  • IJCAIAdaLinUCB: 基于上下文的赌博机的机会学习
    PDF5 years ago
Prev