Jun, 2023

多保真度多臂赌博机再访

TL;DR研究了多精度多臂赌博机(MF-MAB)及其最优臂识别和后悔最小化目标,为BAI提出了成本复杂度下限,推荐两种替代忠诚度选择程序的算法框架,并确定了两种程序的成本复杂度上限,并提出了新的后悔定义,以及解决了该问题的消除算法。