May, 2022

基于安全性的分段独立同分布赌博机变点检测

TL;DR本文考虑在安全约束下,针对分段独立同分布赌博机的问题,引入了适应性算法,探测并重新开始实验,同时提供了相应的遗憾上界和匹配下界。实验表明,相较于不符合安全约束的算法,本文提出的带安全约束的算法性能相似。