Apr, 2021

利用 M - 估计器对自适应收集数据进行统计推断

TL;DR本论文通过理论分析,提出了一种基于 M - 估计量的方法,利用自适应算法(包括习得算法和最大似然算法)处理 bandit 算法采集的数据,进而构建了一种渐进有效的置信区间方法,可用于许多统计推断目标。