关键词sublinear regret
搜索结果 - 29
  • MM不依赖利普希茨连续性的遗憾界:相对利普希茨损失下的在线学习
    PDF4 years ago
  • 有限马尔可夫决策问题中的勘探 - 利用
    PDF4 years ago
  • 无投影随机凸优化
    PDF6 years ago
  • 基于专家预测的无模型线性二次控制
    PDF6 years ago
  • 随机博弈中的在线强化学习
    PDF7 years ago
  • ICML自适应特征选择:基于 RIP 的在线稀疏线性回归的计算有效性
    PDF7 years ago
  • 平滑分段常数函数的在线优化
    PDF8 years ago
  • 带背包的赌博机
    PDF11 years ago
  • 无约束在线凸优化的无悔算法
    PDF12 years ago
Next