Jun, 2020

具有臂依赖性延迟的随机赌博机

TL;DR本文研究随机延迟赌博机问题,提出了一种基于UCB算法的简单但高效的算法——PatientBandits,通过针对延迟赋予限制的方法,得出不同类型问题的效果下限和上限。