Feb, 2024

带干扰的多臂赌博机

TL;DR在当代在线平台中,干扰实验面临重大挑战。本研究介绍了具有干扰的多臂赌博机问题,应用集群随机化策略来达到最优期望后悔值,并得出高概率边界与实验单元数 N 无关。