Nov, 2018

混合鞅方法的再探讨及其在序列检验和置信区间中的应用

TL;DR本文提出了一种新的偏差不等式,该不等式在多臂赌博模型中采用自适应采样,能够在时间上均匀地适配;利用给定一维指数族中的 Kullback-Leibler 离散度衡量偏差,可以同时考虑几个臂,并且通过构建基于分层先验的混合鞅并相乘这些鞅来获得。我们的偏差不等式允许分析基于广义似然比的序列识别问题的停止规则,并为一些臂的均值函数构建严格的置信区间。