Oct, 2023

个性化联邦多臂赌博机

TL;DR本研究通过提出的 PF-PNE 算法,同时优化异构客户端的个性化联邦学习目标,通过特殊的双重淘汰策略安全地消除非最优区域,并通过有偏但有效的本地目标评估鼓励联邦合作。该算法能够处理任意程度的异构性,有限的通信保护客户端奖励数据的机密性。理论分析证明了该算法相比单个客户端算法的优势,实验结果表明 PF-PNE 在合成和真实数据集上优于多个基准算法。