Apr, 2017

增强型UCB算法在阈值赌博机中的应用

TL;DR本文提出了增强UCB(AugUCB)算法,用于限定预算的阈值赌博问题(TBP),其利用均值和方差估计来消除已被充分探索的赌臂,以便识别质量高于阈值的赌臂,经模拟实验验证,AugUCB相对于现有的APT、CSAR和其他非方差算法表现更佳。