Nov, 2021

非平稳对决多臂老虎机的最优高效动态遗憾算法

TL;DR本文研究了$K$-武斗器下在非固态或时变偏好情况下动态遗憾最小化问题,设计了能够有效解决此问题的算法,证明了算法的最优性,并进行了大量模拟和与其他算法对比的实验。