Jan, 2020
基于固定置信度的级联赌博机的最佳臂识别
Best Arm Identification for Cascading Bandits in the Fixed Confidence
Setting
TL;DR该研究设计并分析了CascadeBAI算法,该算法适用于级联赌博框架中找到最佳集合的K个项目,提出了一种新的随机变量类型作为左侧子高斯随机变量,使用一个紧密的Bernstein类型浓度不等式,推导出CascadeBAI的时间复杂度的上界,并且通过推导出时间复杂度下界显示CascadeBAI在某些实用范围内的性能是最优的,并通过广泛的数值模拟证实了CascadeBAI的有效性以及时间复杂度上限的紧密性。