Mar, 2021

广义线性赌臂机在参数漂移下的遗憾界

TL;DR本文探究了广义线性Bandits在非稳态环境中的应用,比如参数漂移等问题,提出了一种新增添的算法,基于动态问题的推断,解决了广义线性Bandits在非稳态环境下表现出的缺陷,拥有了更优秀的性能表现。通过对于动态问题投影过程的修改,我们设计出了一种具有结构性特点的算法。经过实验证明,我们的算法达到了更好的性能表现。