Mar, 2024

带有弗雷歇特 - 类型尾部分布的跟随扰动领导者:对抗性赌博机中的最优性和最佳选择之间的折衷

TL;DR本文研究了在对抗性和随机的 K 臂赌博机中,随机扰动策略(Follow-the-Perturbed-Leader)的最优性。我们建立了对于扰动实现 O (√KT) 遗憾的充分条件,并展示了随机扰动策略在具有特定尾部分布的情况下实现的最佳两者能力。