关键词regret
搜索结果 - 330
  • ICML因果型赌博机:适应性的帕累托最优前沿,相对于线性赌博机的简化以及对未知边际分布的限制
    PDF3 days ago
  • 黑盒预测优化的渐近最优遗憾
    PDF22 days ago
  • 线性二次系统控制的全自适应保证后悔算法
    PDF23 days ago
  • 在线牛顿方法在博弈凸优化问题中的应用
    PDF24 days ago
  • ICML最佳批处理线性赌臂机
    PDFa month ago
  • 通过懒惰算法实现私密在线学习
    PDFa month ago
  • 完全无约束的在线学习
    PDFa month ago
  • 流式随机多臂赌博机中的记忆 - 遗憾权衡理解
    PDFa month ago
  • 多类别 U 校准误差的最优解与进一步
    PDFa month ago
  • 可证明高效的无限时间平均回报线性 MDP 的强化学习
    PDFa month ago
  • 具有半绑定反馈的随机在线一致预测
    PDFa month ago
  • 多类别分类中的强盗信息真实价格
    PDF2 months ago
  • 具有对抗约束的在线凸优化的严格界
    PDF2 months ago
  • 无限时间段折现决策过程的汤普森抽样
    PDF2 months ago
  • 非精确多臂赌博机
    PDF2 months ago
  • IJCAI协同进化和赌博学习算法的浓度尾部限制分析
    PDF2 months ago
  • 关于 UCT、AlphaGo 及其变种的超指数遗憾
    PDF2 months ago
  • $ε$- 在线定价的策略梯度
    PDF2 months ago
  • 在风险敏感的多智能体强化学习中驯化均衡偏差
    PDF2 months ago
  • 上下文决斗赌徒的良好感知汤普森抽样
    PDF3 months ago
Prev