BriefGPT.xyz
Ask
alpha
关键词
aggregate regret
搜索结果 - 2
阈值型赌博机带有最优聚合遗憾
本文提出了 LSA 算法,用于解决阈值赌博机问题,证明了该算法在实例方面渐近最优,通过多种不同情况下的实证结果证明其优于现有算法的表现。
PDF
5 years ago
ICML
自适应多臂识别
研究了如何在随机赌博机游戏中选择期望回报最高的 K 个赌臂问题,提出了一种基于概率近似正确算法,并引入了难度参数来量化问题难度。通过研究两种算法的采样复杂度,得出了更优的上界,并证明了该上界在某些情况下是紧的。同时得出了引入难度参数的实例相
→
PDF
7 years ago
Prev
Next