BriefGPT.xyz
Mar, 2020
对抗性放缩赌博机
Bandits with adversarial scaling
HTML
PDF
Thodoris Lykouris, Vahab Mirrokni, Renato Paes Leme
TL;DR
本研究研究了“对抗缩放”,它是一个多臂老虎机模型,其中奖励有随机的和对抗性的组成部分。Despite模型的相对随机性, 我们展示了两种情况下大多数老虎机算法会遇到困难,同时,我们还展示了一种行动消除和一种镜像下降算法足够适应,能够对对抗性的缩放有很好地鲁棒性。我们的结果揭示了随机老虎机中适应参数选择的鲁棒性,可能是独立感兴趣的。
Abstract
We study "
adversarial scaling
", a
multi-armed bandit model
where rewards have a stochastic and an adversarial component. Our model captures
displ
→