Mar, 2020

对抗性放缩赌博机

TL;DR本研究研究了“对抗缩放”,它是一个多臂老虎机模型,其中奖励有随机的和对抗性的组成部分。Despite模型的相对随机性, 我们展示了两种情况下大多数老虎机算法会遇到困难,同时,我们还展示了一种行动消除和一种镜像下降算法足够适应,能够对对抗性的缩放有很好地鲁棒性。我们的结果揭示了随机老虎机中适应参数选择的鲁棒性,可能是独立感兴趣的。