BriefGPT.xyz
Ask
alpha
关键词
confidence parameter
搜索结果 - 1
优化置信区间上界算法:改进有限臂赌博机的遗憾
提出了一种基于 UCB 并具有适当的置信参数平衡风险和过度乐观代价的随机有限臂老虎机算法,同时具有最优问题依赖性遗憾和最坏情况遗憾。
PDF
9 years ago
Prev
Next