关键词regret analysis
搜索结果 - 51
  • 随机线性赌博机中的近似推断贝叶斯赌博算法
    PDF16 days ago
  • 基于近似采样的强化学习更高效的随机探索
    PDF18 days ago
  • KDD线性上下文强化学习与混合回报:重温
    PDF22 days ago
  • 次线性时间下的拟阵半赌博问题
    PDFa month ago
  • 关于具有多臂赌博反馈的激励兼容在线学习中确切真实性的价格:WSU-UX 的遗憾下界
    PDF3 months ago
  • 经证明高效的部分可观察风险敏感强化学习与事后观测
    PDF4 months ago
  • 利用混淆和选择偏倚离线数据强化改进赌博算法:一种因果方法
    PDF7 months ago
  • 部分可观察排队网络中的最优入场控制学习
    PDFa year ago
  • 公平最优多智能体赌博机
    PDFa year ago
  • 在线张量学习:计算和统计权衡,适应性和最优遗憾
    PDFa year ago
  • 自回归系统外部输入下的最小方差控制的有限时间遗憾界
    PDFa year ago
  • 具有异构观测数据的联邦离线策略学习
    PDFa year ago
  • 贝叶斯劝服下的动态定价与学习
    PDFa year ago
  • ICLR具有切换成本的近优敌对强化学习
    PDFa year ago
  • 通过可证明遗憾界实现分布式和风险敏感的强化学习
    PDF2 years ago
  • 顺序信息设计:在暗中学习说服
    PDF2 years ago
  • 概率触发臂或独立臂组合半匪徒问题的无关批量大小的后悔界限
    PDF2 years ago
  • AAAI层次专家赌博问题的遗憾分析
    PDF2 years ago
  • 元学习对抗性赌博机
    PDF2 years ago
  • IJCAI匹配市场中的赌博学习的汤普森抽样
    PDF2 years ago
Prev