Mar, 2023

具上下文的组合赌博机、概率挑战的手臂

TL;DR本文针对情境组合赌博问题,提出了一种具有触发概率和方差自适应的算法,并给出了相应的遗憾界。在合成和真实世界数据集上的实验结果表明算法的优越性。