May, 2022

多播赌博机快速变化识别及其在无线网络中的应用

TL;DR研究了一种新型多臂赌博机(MAB)设置,通过广播探测所有的“手臂”,同时记录非平稳环境下的当前最优手臂,以平衡传统汤普森抽样(TS)的遗憾保证与同时广播的改进探测方法(BP),并通过可选子程序组探索(GE)识别改变的手臂,以检测奖励分布的变化,并在移动边缘计算(MEC)和无线信息和功率传输(SWIPT)两个无线系统应用中展示了其有效性。