Jun, 2021

鲁棒随机线性情境臂带在对抗攻击下的应用

TL;DR提出了第一个针对全面适应性攻击的稳健性线性上下文bandit算法,其不仅可以抵御回报攻击,还可以抵御袭击环境,提高了对各种流行攻击的稳健性。