关键词sublinear regret
搜索结果 - 29
  • 在线多组学习的分组式高效算法
    PDFa month ago
  • 具有个性化奖励的可证明高效的交互式根植学习
    PDFa month ago
  • 完全无约束的在线学习
    PDFa month ago
  • 无遗憾并不足够!通过自适应遗憾最小化处理具有一般约束的赌博机
    PDF2 months ago
  • 多阶段系统的分布式无悔学习与端到端强化学习反馈
    PDF3 months ago
  • 学习具有随机硬约束的对抗式马尔可夫决策过程
    PDF4 months ago
  • 在受限马尔可夫决策过程中的真正无悔学习
    PDF4 months ago
  • 黑暗中的游戏:带有对抗性约束的无悔学习
    PDF8 months ago
  • $α$- 公平上下文强化学习
    PDF8 months ago
  • 有限内存下降低方差的在线梯度下降法在核化对学习中的应用
    PDF9 months ago
  • 重复委派选择的遗憾分析
    PDF9 months ago
  • 在线凸优化下的在线次模最大化
    PDF10 months ago
  • 带预测内容的在线强盗学习
    PDFa year ago
  • 在线最近邻分类
    PDFa year ago
  • 无投影在线随机约束凸优化
    PDFa year ago
  • 具有弹奏反馈的安全优化中约束集的几何属性的影响
    PDFa year ago
  • ICML在线持续上下文推荐系统超参数优化
    PDFa year ago
  • 终身赌徒优化:无先验和无遗憾
    PDF2 years ago
  • 无遗憾学习匹配:基于 Markov 匹配市场的强化学习
    PDF2 years ago
  • 基于 Wasserstein 的非平稳在线随机优化
    PDF4 years ago
Prev