Feb, 2020

针对对抗性线性情境赌博机的高效稳健算法

TL;DR针对经典 $K$-armed 线性上下文对抗性问题,我们开发了基于 Exp3 算法的计算有效算法,其中包含实时算法和鲁棒算法,它们能够实现良好的失望保证,并且对于线性奖励函数而言具有稳健性。