关键词bandit convex optimization
搜索结果 - 13
  • 带有延迟反馈的强化学习优化中的改进后悔度
    PDF5 months ago
  • 二阶方法在赌局优化和控制中的应用
    PDF5 months ago
  • 联邦在线与强盗凸优化
    PDF7 months ago
  • 多点带约束的强化凸优化反馈
    PDF9 months ago
  • 非随机控制赌博机的最优率
    PDFa year ago
  • AAAI具有隐私保证的无投影赌率优化
    PDF4 years ago
  • 带有赌博反馈的非随机控制
    PDF4 years ago
  • 无投影赌博凸优化改进遗憾界
    PDF5 years ago
  • 非静态环境下的臂匠凸优化
    PDF5 years ago
  • 具未知延迟的强盗在线学习
    PDF6 years ago
  • 无投影随机凸优化
    PDF6 years ago
  • (有偏) 带噪声梯度预言的凸优化
    PDF8 years ago
  • 带两点反馈的赌博机和零阶凸优化的最优算法
    PDF9 years ago
Prev
Next