关键词pure exploration
搜索结果 - 16
  • 部分可观测马尔可夫决策过程中纯探索策略的局限性:观测信息熵的足够性
    PDF18 days ago
  • 无性能损失的批量顺序减半算法
    PDFa month ago
  • 具有嘈杂歧义回答的高效查询相关聚类
    PDF5 months ago
  • 批处理多臂赌博机问题中的最佳臂识别
    PDF7 months ago
  • 双线性强盗问题中的纯探索多任务表示学习
    PDF8 months ago
  • 最佳选择躲避:关于多臂老虎机的纯探索的近最优多遍流式下限
    PDF10 months ago
  • 关于插值专家和多臂赌博机的研究
    PDFa year ago
  • 无限臂老虎机渐进最优纯探索
    PDFa year ago
  • 一种用于动作 - 状态熵正则化奖励最大化的通用马尔可夫决策过程形式化方法
    PDFa year ago
  • 因果赌博机的组合式纯探索
    PDF2 years ago
  • 核和神经赌博中的纯探索
    PDF3 years ago
  • 改进线性逻辑模型的置信区间界限及在线性赌博机中的应用
    PDF4 years ago
  • ICML线性赌博机探索的游戏化
    PDF4 years ago
  • 通过解游戏进行非渐近纯探索
    PDF5 years ago
  • 线性赌臂机中纯探索的完全自适应算法
    PDF7 years ago
  • Maximin Action Identification:一种新的用于游戏的 Bandit 框架
    PDF8 years ago
Prev
Next