关键词regret minimization
搜索结果 - 122
  • 重尾臂赌博机中实现全自适应遗憾最小化
    PDF9 months ago
  • 聚类多智能体线性赌博
    PDF10 months ago
  • 线性最佳臂识别中的安全性价格
    PDF10 months ago
  • 线性马尔可夫决策过程的速率最优策略优化
    PDF10 months ago
  • 一种高效的在线凸优化内点方法
    PDFa year ago
  • 透明度在重复的未知估值一次报价拍卖中的作用
    PDFa year ago
  • 比例响应:用于简单和累积遗憾最小化的情境赌博机算法
    PDFa year ago
  • ICML局部差分隐私下伯努利奖励的汤普森抽样
    PDFa year ago
  • 可上下文化的随机臂赌博机
    PDFa year ago
  • 多保真度多臂赌博机再访
    PDFa year ago
  • 多平台广告市场中使用非 IC 拍卖的预算管理
    PDFa year ago
  • ICML单次遍历流式多臂赌博机的严格遗憾界
    PDFa year ago
  • ICML带有重尾奖励的差分隐私情节强化学习
    PDFa year ago
  • 有期半马尔科夫决策过程中基于期权的遗憾最小化算法分析
    PDFa year ago
  • 基于事后校正的分支学习算法用于带未知参数约束的预测优化问题
    PDFa year ago
  • MAC-PO: 基于集体优先级优化的多智能体经验回放
    PDFa year ago
  • AAAI具有不确定情节长度的在线强化学习
    PDFa year ago
  • 对抗性在线多任务强化学习
    PDFa year ago
  • HSVI 能够解决零和部分可观察随机博弈
    PDF2 years ago
  • ICML基于无界时间跨度和方差的隐含马尔可夫决策过程强化学习
    PDF2 years ago