BriefGPT.xyz
Ask
alpha
关键词
ucb-type algorithms
搜索结果 - 2
用于带有重和超重对称噪声的随机赌博机的快速 UCB 类型算法
提出了基于一种不精确预算方法的智能多臂赌博机构建 UCB 型算法的新方法;推导出了相应于最优化方法的收敛速度的遗憾界;提出了一种新的算法 Clipped-SGD-UCB,并从理论和实证角度展示了在奖励中存在对称噪声的情况下,我们可以达到 O
→
PDF
5 months ago
Kullback-Leibler Divergences 下多臂老虎机问题的有限时间分析
本文考虑了基于 KL 距离的随机多臂赌博机问题,并给出了一个可使渐进遗憾率达到 Burnetas 和 Katehakis 算法下界的算法,并对此算法进行了有限时间分析,其结果表明其主要项比之前的有限时间算法(如 UCB 类型算法)小。
PDF
13 years ago
Prev
Next