关键词sublinear regret
搜索结果 - 29
- MM不依赖利普希茨连续性的遗憾界:相对利普希茨损失下的在线学习PDF4 years ago
- 有限马尔可夫决策问题中的勘探 - 利用PDF4 years ago
- 无投影随机凸优化PDF6 years ago
- 基于专家预测的无模型线性二次控制PDF6 years ago
- 随机博弈中的在线强化学习PDF7 years ago
- ICML自适应特征选择:基于 RIP 的在线稀疏线性回归的计算有效性PDF7 years ago
- 平滑分段常数函数的在线优化PDF8 years ago
- 带背包的赌博机PDF11 years ago
- 无约束在线凸优化的无悔算法PDF12 years ago
Next