关键词regret rate
搜索结果 - 10
- 在线学习中的交易量最大化PDF2 months ago
- 在线本地误发现率控制:一种资源分配方法PDF5 months ago
- 使用 VB-FTRL 通过对数损失在线学习量子态PDF8 months ago
- 基于核 $ε$-Greedy 策略的情境赌博机PDFa year ago
- 延迟赌博机:何时中间观察有帮助?PDFa year ago
- ICLR对抗性贝叶斯强化学习的对抗攻击PDFa year ago
- ICML双重稳健分布稳健离线评估与学习PDF2 years ago
- 在线非凸学习:跟随扰动领袖是最优的PDF5 years ago
- 带有部分反馈的在线分类的机会均等性PDF5 years ago
- REGAL:一种基于正则化的弱通信 MDP 强化学习算法PDF12 years ago
Prev
Next