Jun, 2024

一种用于合作资源分配的联合在线不安分强盗框架

TL;DR使用联邦学习范式,本研究提出了一种基于 Federated Thompson Sampling-enabled Whittle Index (FedTSWI) 算法的合作式资源分配问题解决方案,该算法在通信和计算效率上具有较高水平并提供隐私保证,并在在线多用户多信道访问案例中展示了快速收敛率和比基准方法更好的性能。值得注意的是,该算法的样本复杂度随代理数量而减少。