Jan, 2022

几乎最优方差约束的最佳臂识别

TL;DR本文提出 VA-LUCB,并分析其在严格限制下寻找最佳选择时的表现,通过实验结果表明 VA-LUCB 在风险受限制的最佳选择问题类别中具有最低的样本复杂度。