关键词multi-armed bandits
搜索结果 - 78
  • EduQate: 在教育场景中通过 RMABs 生成自适应课程
    PDF14 days ago
  • ICML贝叶斯数据选择
    PDF16 days ago
  • 无性能损失的批量顺序减半算法
    PDFa month ago
  • 因果抽象多臂赌博机
    PDF2 months ago
  • 大型语言模型的假设生成
    PDF3 months ago
  • 改进的多臂赌博机问题的近乎紧密逼近保证
    PDF3 months ago
  • 具上下文的无休止多臂赌博机在需求响应决策中的应用
    PDF3 months ago
  • 基于种群的强化学习的相位多样性优化
    PDF4 months ago
  • 带干扰的多臂赌博机
    PDF5 months ago
  • ICLR自适应遗憾在可能的情况下:只需两个查询
    PDF6 months ago
  • 强化学习和交互决策的基础
    PDF6 months ago
  • 异步联邦赌臂纯探索
    PDF9 months ago
  • 贝叶斯设计原则在频率学派的顺序学习中的应用
    PDF9 months ago
  • 最佳选择躲避:关于多臂老虎机的纯探索的近最优多遍流式下限
    PDF10 months ago
  • 元学习对抗强盗算法
    PDFa year ago
  • 使用遗忘采样器在低秩结构的多臂老虎机中进行纯探索
    PDFa year ago
  • 基于序列的最优臂识别及其在脑机接口中的应用
    PDFa year ago
  • 多臂老虎机用于多任务神经求解器的高效训练
    PDFa year ago
  • 停机多臂赌博模型的最优激活
    PDFa year ago
  • 推荐系统中的赌博算法现场测试:理解多臂赌博机对人类偏好假设的有效性
    PDFa year ago
Prev