本文就基于上下文线性赌博机的联邦学习问题提出了一种称为 FedUCB 的多代理私有算法,该算法在中央化和去中心化(点对点)联邦学习方案中均可使用,在保证通信隐私的同时,在后遗憾度和隐私保证方面表现出极强的实用性。
Oct, 2020
提出了个性化联邦多臂老虎机 (PF-MAB) 的总体框架,研究了一个灵活平衡泛化和个性化的混合老虎机学习问题,并提出了个性化联邦上置信上界 (PF-UCB) 算法,在理论分析和实验方面都取得了良好效果。
Feb, 2021
本文提出了一种新型的联邦线性情境赌博机模型 Fed-PE,并采用协作算法来处理客户端的异质性,它基于新颖的多客户 G - 最优设计,并通过对不相交和共享参数情况下的对数通信成本,实现了几乎最优的遗憾。此外,本文还引入了一种新的概念 —— 共线依赖策略,并基于此导出了不相交参数情况下的严格极小化遗憾下界。实验结果表明,该算法在合成和真实数据集上均具有很好的鲁棒性。
Oct, 2021
提出针对多臂赌博机模型(MAB)的新型组合睡眠 MAB 模型。通过扩展在线学习算法 UCB 以处理利用和探索之间的权衡,同时采用虚拟队列技术来正确处理公平性约束。最终提出一种名为 LFG 的新算法,可保证可行性最优,具有受时间平均后悔上限约束的时间复杂度,并进行了广泛的模拟以证明其有效性。
Jan, 2019
本文探讨了结合差分隐私和多智能体赌博学习的联邦私有赌博机制。我们研究了如何将基于差分隐私的置信上界方法应用于多智能体环境,特别是应用于主 - 从和完全分散的联邦学习环境中,并提供了有关所提出方法的隐私和后悔性能的理论分析,并探讨了这两者之间的权衡。
May, 2020
这篇论文提出了联邦多臂老虎机的新模型,并研究了两个具体的联邦多臂老虎机模型,提出了 Federated Double UCB 方法用于解决两个模型,理论与实验结果表明了该算法的效果和高效性。
Jan, 2021
深入研究了公平性,提出了一种基于两个层次的公平性方法,保证每个组的最小曝光,并确保组内每个单元根据其优越性被拉动;通过提出的算法 BF-UCB,实现了对遗憾的上界为 O (√T) 的平衡,同时提供更好的组和个体曝光保证,并且不会显著降低奖励。
Feb, 2024
本文旨在探索线性上下文强化学习在联邦学习环境下的应用,提出了一种基于异步模型更新和通信的通用框架,并对分布式学习下的遗憾和通信成本进行了理论分析,并进行了广泛的实证评估,证明了该解决方案的有效性。
本篇论文介绍了联邦神经 - 上置信区间算法 (FN-UCB),该算法采用两个上界置信区间 (UCB) 的加权组合,以更好地利用联合设置,并证明了 FN-UCB 的累积后悔和通信轮数上限。
May, 2022
研究了在联邦学习中维持隐私的问题,提出了一种隐私保护的联邦组合赌博算法,P-FCB,该算法在保持敏感信息私密的同时提高了效率和减少后悔的风险。
Jun, 2022