关键词asymptotic optimality
搜索结果 - 16
  • ICML最佳批处理线性赌臂机
    PDFa month ago
  • 自适应众包通过自监督学习
    PDF5 months ago
  • ICML嵌套消除算法:基于选择反馈的最佳项目识别的简单算法
    PDFa year ago
  • 具有平均奖励的不安定强盗:打破统一全局吸引子假设
    PDFa year ago
  • 有限时间和流式无休止多臂赌博机问题的高效算法
    PDF3 years ago
  • ICML支持感知 CVaR 赌博机的最优汤普森抽样策略
    PDF4 years ago
  • 适用于非政策评估的极大极小权重和 Q 函数学习
    PDF5 years ago
  • X - 臂赌博机的多项式适应代价
    PDF5 years ago
  • 有限时间内动态赌博机渐近最优指数策略
    PDF7 years ago
  • 可扩展渐进最优多机器人运动规划
    PDF7 years ago
  • 异构过程中的主动异常检测
    PDF7 years ago
  • 高斯赌博机的 Thompson 抽样策略的最优性取决于先验知识
    PDF11 years ago
  • $QD$-Learning: 一种多智能体强化学习的合作式分布式策略,通过共识 + 创新实现
    PDF12 years ago
  • 主动顺序假设检验
    PDF12 years ago
  • 基于逐步采样的最优运动规划算法
    PDF14 years ago
  • 多臂赌博问题中有限支持模型的渐近最优策略
    PDF15 years ago
Prev
Next