Feb, 2018

关于突发性和缓慢变化的多臂赌博问题

TL;DRLM-DSEE与SW-UCB#两种算法解决了非稳态随机多臂赌博问题,在突变和缓慢变化的环境下,这些算法在时间上的预期总遗憾被控制在时间的子线性函数上。