关键词exploitation
搜索结果 - 39
  • 连续状态空间中的显式探索 - 利用算法
    PDF5 years ago
  • ICLRVariBAD:基于元学习的 Bayes - 自适应深度强化学习的非常好方法
    PDF5 years ago
  • 上下文臂选择模型
    PDF5 years ago
  • AAAI生成式探索与利用
    PDF5 years ago
  • 模型不确定性下的稳健自适应规划
    PDF5 years ago
  • 强化学习中的探索与利用:一种随机控制方法
    PDF6 years ago
  • NIPS利用隐空间动态模型的信息最大化探索
    PDF6 years ago
  • 线性上下文贪婪算法问题的平滑分析
    PDF6 years ago
  • Rowhammer 防御墙又倒下一砖
    PDF7 years ago
  • 腐败赌徒
    PDF7 years ago
  • 信息搜索中的风险与歧义:眼动模式揭示应对不确定性的情境行为
    PDF8 years ago
  • 探索然后执行策略
    PDF8 years ago
  • 非静态奖励多臂老虎机问题中的最优探索利用
    PDF10 years ago
  • 信息引导采样的优化学习
    PDF10 years ago
  • 基于置信区间和不安定多臂赌博模型的感知策略
    PDF12 years ago
  • NIPS使用基于样本的搜索实现高效的贝叶斯自适应强化学习
    PDF12 years ago
  • NIPS高斯系统的最优强化学习
    PDF13 years ago
  • 昂贵代价函数的贝叶斯优化教程,及其在主动用户建模和分层强化学习中的应用
    PDF14 years ago
  • 强化学习:一项调查
    PDF28 years ago
Next