Apr, 2023

受通信限制的加性高斯噪声下赌博机问题

TL;DR研究了分布式随机多臂赌博问题,其通信反馈受到编码和加性高斯噪声的约束,在此情形下,提出了多相赌博算法UE-UCB ++,该算法在初始阶段进行均匀探索,随后在最终阶段使用UCB算法,且均匀探索阶段形成的平均奖励的较粗估计有助于优化编码协议,从而减少均匀探索圈数,与所得到的信息理论下限较为接近。