Jul, 2020

基于多臂赌博机的联邦学习客户端调度

TL;DR本文提出了一个基于多臂赌博机策略的在线客户端调度(CS)框架,用于减少联邦学习中数百到数千个通信轮延迟。两个基于上置信区间(UCB)策略的 CS 算法(CS-UCB 和 CS-UCB-Q)被提出以应对不理想的本地数据集的非独立、不平衡属性和客户可用性的变化。本文还分析了 FL 训练的收敛性能,并且模拟结果验证了所提出的算法的有效性。