Oct, 2023

高效纯探索的双向算法设计

TL;DR在具有有限备选方案的随机顺序自适应实验中,我们考虑了纯探索问题。利用双变量,我们表征了最优分配的必要和充分条件,并提出了一个信息导向的选择规则。我们证明了,在某些条件下,与信息导向的选择相结合的前二 Thompson 抽样在高斯最优臂标识中是(渐近)最优的。