IJCAIApr, 2022

有限共享资源臂的多人多臂赌博机:学习算法与应用

TL;DR本研究提出 Multi-player multi-armed bandits with shareable resources 模型,针对共享资源的两种反馈信号提出 DPE-SDI 和 SIC-SDA 算法,证明它们的遗憾数在回合数上是紧的,并通过模拟验证算法的性能和在无线网络和边缘计算中的实用性。