关键词stochastic multi-armed bandits
搜索结果 - 21
  • 基于数据驱动的上界置信度在重尾赌博机上的近优遗憾
    PDFa month ago
  • ICML利用(有偏)信息:带离线数据的多臂老虎机
    PDF2 months ago
  • 用于带有重和超重对称噪声的随机赌博机的快速 UCB 类型算法
    PDF5 months ago
  • 随机赌博机中同时实现群体曝光公平和组内精英主义
    PDF5 months ago
  • 固定预算下的最优臂识别:大偏差视角
    PDF7 months ago
  • 在调解员反馈下的纯粹探索
    PDF10 months ago
  • ICML带对数通信的 Langevin Thompson Sampling:赌博机和强化学习
    PDFa year ago
  • ICML协作多智体异构多臂赌博机
    PDFa year ago
  • ICML多臂赌博机探索中的资源分配:通过自适应并行处理克服亚线性缩放
    PDF4 years ago
  • ICML通过奖励偏置探索:针对随机多臂赌博机的奖励偏置最大似然估计
    PDF5 years ago
  • 分布相关和时间均匀的分段 i.i.d. 摇臂界
    PDF5 years ago
  • ICML随机赌博机上的数据污染攻击
    PDF5 years ago
  • 更好的随机赌博机算法与对抗性干扰
    PDF5 years ago
  • 腐烂强盗并不比随机强盗更难
    PDF6 years ago
  • 多人赌博机问题:一种追踪方法
    PDF6 years ago
  • 多臂老虎机中带延迟反馈的最佳臂识别
    PDF6 years ago
  • 组合型纯探索的近最优采样算法
    PDF7 years ago
  • 正确地进行玻尔兹曼探索
    PDF7 years ago
  • ICML单模臂:遗憾下限和最优算法
    PDF10 years ago
  • 多臂赌博机中的风险规避
    PDF11 years ago
Prev