Dec, 2023

固定预算下的最优臂识别:大偏差视角

TL;DR通过大偏差原理,我们在适应性算法中建立了样本抽取比例与样本奖励之间的联系,从而改进了现有算法并设计了新算法,我们证明了新算法的性能优于现有算法,包括对众多抽样的广泛实验证实了这一观察结果。