Jun, 2019

应用于 A/B 测试和最佳臂识别的分位数序列估计

TL;DR该研究论文提出了一种置信度序列方法,可用于跟踪任何完全排序集合上的分布分位数,同时提供了新的经验分布函数的集中不等式,并在多臂老虎机框架中提供了选择玩家的新算法和样本复杂度边界。