AAAINov, 2021

最大 - 最小分组赌博机

TL;DR介绍了一种多臂赌博机问题,称为最大最小分组赌博机问题,其中将赌臂分组,并旨在找到最差赌臂平均回报最高的组;提出两种基于连续淘汰和鲁棒优化的算法,并导出保证找到最优或接近最优组的样本数的上界,以及一个独立于算法的下界。探讨了各种相关情况下上下限的紧度以及导出统一紧限的困难。