关键词regret
搜索结果 - 331
  • 利用可行集的曲率在在线凸优化中获得快速速率
    PDF5 months ago
  • 分布式内核赌博机中使用共享随机采样的最佳订单遗憾
    PDF5 months ago
  • 解耦学习与决策:用一阶方法突破在线资源分配中的 $O (√T)$ 障碍
    PDF5 months ago
  • 一种带有演化操作的赌博机方法进行模型选择
    PDF5 months ago
  • 非平稳潜在自回归赌博算法
    PDF5 months ago
  • 通过原始 - 对偶策略梯度算法学习无限时域平均奖励受限马尔可夫决策过程的通用参数化策略
    PDF5 months ago
  • 自适应约束下的自训练近最优强化学习
    PDF5 months ago
  • GuReT:区分罪恶和遗憾相关文本
    PDF5 months ago
  • 面向广告牌广告的无悔时间槽分配
    PDF5 months ago
  • 印地语天城文多类遗憾检测
    PDF5 months ago
  • 预测成功的四个方面:校准性、预测能力、随机性和遗憾
    PDF5 months ago
  • 广义低秩矩阵强盗问题的高效框架
    PDF6 months ago
  • 自适应线性二次控制的非渐进遗憾分析及模型误差
    PDF6 months ago
  • 一种层次最近邻方法用于背景环境下的 Bandits
    PDF7 months ago
  • 专家引导的贝叶斯优化方法用于已知系统的人机交互式实验设计
    PDF7 months ago
  • MM具有单调对手的对决优化
    PDF8 months ago
  • 线性赌博机的集成抽样:小集成即可
    PDF8 months ago
  • 无噪音奖励和无通信的最佳合作多人学习赌博机
    PDF8 months ago
  • 基于学习的线性二次高斯控制附加勘探的遗憾分析
    PDF8 months ago
  • 高维线性多臂赌博机与背包问题
    PDF8 months ago