Feb, 2020

针对对抗性线性情境赌博机的高效稳健算法

TL;DR针对经典$K$-armed线性上下文对抗性问题,我们开发了基于Exp3算法的计算有效算法,其中包含实时算法和鲁棒算法,它们能够实现良好的失望保证,并且对于线性奖励函数而言具有稳健性。