May, 2019

广义线性赌博机中最佳臂的识别

TL;DR针对广义线性赌博机的最佳臂识别问题,提出了第一个算法,并在模拟中评估其性能和采样效率。该算法旨在最小化确定足够接近最佳臂所需的臂拉取次数。