Feb, 2024

上下文多臂赌博机的树集成

TL;DR我们提出了一种基于树集成的上下文多臂赌博机的新框架,通过整合上界置信度和汤普森采样两种广泛使用的赌博机方法,用于标准和组合设置。通过几项实验研究,我们使用了流行的树集成方法 XGBoost 来证明我们的框架的有效性。与基于神经网络的最先进方法相比,我们的方法在减小遗憾和计算运行时间方面表现出更好的性能,当应用于基准数据集和在道路网络上的实际导航应用中。