Nov, 2020

改进线性逻辑模型的置信区间界限及在线性赌博机中的应用

TL;DR本文中,我们基于对 logistic 损失的自共轭分析提出了改进的固定设计置信区间用于线性 logistic 模型,避免了对所有臂奖励分布的最小方差 $\kappa$ 的直接依赖。我们提供了两个应用程序,以及一个下界,证明了性能保证的最新进展。