关键词bandits
搜索结果 - 17
  • KDDDISCO: 个性化折扣分配的端到端赌博框架
    PDF24 days ago
  • 理解预训练变压器在序贯决策中的训练和泛化
    PDFa month ago
  • 面向基于行动者和表格式马尔可夫决策的有原则实用策略梯度
    PDFa month ago
  • 零膨胀臂
    PDF6 months ago
  • 强健性多臂赌博机算法对错误假设的鲁棒性研究
    PDF9 months ago
  • 互动和集中的差分隐私对于赌博机
    PDF10 months ago
  • 一种改进的延迟反馈赌博机算法
    PDF10 months ago
  • 医生对口罩使用的结论:有用但需辩证看待
    PDFa year ago
  • 语音和语言处理中的强化学习与赌博算法:教程,评论与展望
    PDF2 years ago
  • 线性混合 MDP 的高效无界强化学习算法
    PDF2 years ago
  • 核和神经赌博中的纯探索
    PDF3 years ago
  • ICML高斯过程赌博机中的宽容后悔和良好动作识别
    PDF3 years ago
  • 贝叶斯最佳臂识别的固定置信度保证
    PDF5 years ago
  • MaxGap Bandit:适应性算法用于近似排名
    PDF5 years ago
  • 在线赌博游戏聚类算法的改进
    PDF5 years ago
  • 有限未知估值的动态定价
    PDF6 years ago
  • Matroid Bandits: 快速组合优化与学习
    PDF10 years ago
Prev
Next