对抗性放缩赌博机

Mar, 2020

Bandits with adversarial scaling

Thodoris Lykouris, Vahab Mirrokni, Renato Paes Leme

TL;DR本研究研究了“对抗缩放”，它是一个多臂老虎机模型，其中奖励有随机的和对抗性的组成部分。Despite模型的相对随机性, 我们展示了两种情况下大多数老虎机算法会遇到困难，同时，我们还展示了一种行动消除和一种镜像下降算法足够适应，能够对对抗性的缩放有很好地鲁棒性。我们的结果揭示了随机老虎机中适应参数选择的鲁棒性，可能是独立感兴趣的。

Abstract

We study "adversarial scaling", a multi-armed bandit model where rewards have a stochastic and an adversarial component. Our model captures displ