Mar, 2021

非平稳线性赌臂问题的简单解法

TL;DR本文研究了非平稳线性臂问题,提出了一种基于重启策略的算法以平衡利用和探索,并证明了该算法的动态遗憾值,同时还解决了现有算法中的严重技术缺陷问题。