May, 2023

鲁棒利普希茨贝叶斯在对抗扰动下的决策

TL;DR本文提出了第一行对抗下的强、弱 Lipschitz bandit 算法,能在无总损坏预算的情况下,在两种类型的对手下实现次线性后悔,但强对手情况下表现最优,并通过对两种经典攻击的试验证明了该算法的有效性。