Jul, 2022

上下文赌博机的最优PAC算法

TL;DR本文研究了 $(\epsilon,\delta)-\textit{PAC}$ 场景下的随机赌博机问题,给出了上下界,并提供了一个新的基于 argmax Oracle 的实例最优和计算效率高的算法。