Feb, 2020

非平稳环境下的组合半赌博算法

TL;DR该研究探讨了非静态组合半强盗问题,研究了在动态和切换的情况下,算法所能达到的最佳后悔上限以及需要提前了解的参数,并提供了无需先知参数的算法。