关键词regret rate
搜索结果 - 10
  • 在线学习中的交易量最大化
    PDF2 months ago
  • 在线本地误发现率控制:一种资源分配方法
    PDF5 months ago
  • 使用 VB-FTRL 通过对数损失在线学习量子态
    PDF8 months ago
  • 基于核 $ε$-Greedy 策略的情境赌博机
    PDFa year ago
  • 延迟赌博机:何时中间观察有帮助?
    PDFa year ago
  • ICLR对抗性贝叶斯强化学习的对抗攻击
    PDFa year ago
  • ICML双重稳健分布稳健离线评估与学习
    PDF2 years ago
  • 在线非凸学习:跟随扰动领袖是最优的
    PDF5 years ago
  • 带有部分反馈的在线分类的机会均等性
    PDF5 years ago
  • REGAL:一种基于正则化的弱通信 MDP 强化学习算法
    PDF12 years ago
Prev
Next