Jun, 2024

无性能损失的批量顺序减半算法

TL;DR本文研究了多臂赌博机中纯探索问题,特别关注批处理中的臂拉取情况。我们引入了一个简单的批处理版本的顺序减半算法,并从理论上证明在实际条件下批处理不会降低原算法的性能。此外,通过实验证明了顺序减半算法在固定批处理设置下的稳健性。