Aug, 2024

在全球环境变化下识别最佳臂

TL;DR本文针对非平稳随机赌博机中的最佳臂识别问题,提出了一种新的解决方案。研究展示了现有方法未能充分利用环境变化的特性,因此效果不佳;为此,开发了一种一致且稳健的选择策略,以及一种利用环境间全球变化信息的分配策略LinLUCB,实验证明了其显著优越性。