关键词regret
搜索结果 - 329
  • 黑盒预测优化的渐近最优遗憾
    PDF4 days ago
  • 线性二次系统控制的全自适应保证后悔算法
    PDF5 days ago
  • 在线牛顿方法在博弈凸优化问题中的应用
    PDF6 days ago
  • ICML最佳批处理线性赌臂机
    PDF10 days ago
  • 通过懒惰算法实现私密在线学习
    PDF11 days ago
  • 完全无约束的在线学习
    PDF17 days ago
  • 流式随机多臂赌博机中的记忆 - 遗憾权衡理解
    PDF17 days ago
  • 多类别 U 校准误差的最优解与进一步
    PDF19 days ago
  • 可证明高效的无限时间平均回报线性 MDP 的强化学习
    PDF24 days ago
  • 具有半绑定反馈的随机在线一致预测
    PDF25 days ago
  • 多类别分类中的强盗信息真实价格
    PDFa month ago
  • 具有对抗约束的在线凸优化的严格界
    PDFa month ago
  • 无限时间段折现决策过程的汤普森抽样
    PDFa month ago
  • 非精确多臂赌博机
    PDFa month ago
  • IJCAI协同进化和赌博学习算法的浓度尾部限制分析
    PDFa month ago
  • 关于 UCT、AlphaGo 及其变种的超指数遗憾
    PDFa month ago
  • $ε$- 在线定价的策略梯度
    PDFa month ago
  • 在风险敏感的多智能体强化学习中驯化均衡偏差
    PDFa month ago
  • 上下文决斗赌徒的良好感知汤普森抽样
    PDF2 months ago
  • 原始 - 对偶优化中的需求平衡用于盲目网络收入管理
    PDF2 months ago
Prev