关键词sub-linear regret
搜索结果 - 5
  • 网络资源分配的在线优化及与强化学习技术的比较
    PDF8 months ago
  • 鲁棒利普希茨贝叶斯在对抗扰动下的决策
    PDFa year ago
  • AAAI有限时段不静态多臂多动作赌博机的强化学习
    PDF3 years ago
  • 基于上下文信息的无监督连续选择在线算法
    PDF4 years ago
  • 线性二次型调节器的鲁棒自适应控制遗憾界
    PDF6 years ago
Prev
Next