Apr, 2024

改进的多臂赌博机问题的近乎紧密逼近保证

TL;DR我们对改进的多臂赌博机问题给出了近似最优的上下界。我们证明了对于任何随机在线算法,存在一个实例使其相对于最优收益至少有一个 Ω(√k) 的近似因子。然后,我们提供了一个随机在线算法,在事先告知最优臂可达到的最大收益的情况下,保证了一个 O (√k) 的近似因子。我们接下来展示了如何消除这一假设,以增加 O (log k) 的近似因子,从而实现了相对于最优的 O (√k log k) 的整体近似。