Feb, 2024

贝叶斯框架下的固定置信度最佳臂识别

TL;DR在贝叶斯设置下,我们研究了固定置信度最佳臂识别问题。我们证明了传统的FC-BAI算法在贝叶斯设置下会导致任意次优的性能,并且介绍了一种连续淘汰的变体,其性能与下界匹配,仅有一个对数因子的差距。模拟实验验证了理论结果。