基于多臂赌博机的联邦学习客户端调度

Jul, 2020

基于多臂赌博机的联邦学习客户端调度

Multi-Armed Bandit Based Client Scheduling for Federated Learning

Wenchao Xia, Tony Q. S. Quek, Kun Guo, Wanli Wen, Howard H. Yang...

TL;DR本文提出了一个基于多臂赌博机策略的在线客户端调度（CS）框架，用于减少联邦学习中数百到数千个通信轮延迟。两个基于上置信区间（UCB）策略的 CS 算法（CS-UCB 和 CS-UCB-Q）被提出以应对不理想的本地数据集的非独立、不平衡属性和客户可用性的变化。本文还分析了 FL 训练的收敛性能，并且模拟结果验证了所提出的算法的有效性。

Abstract

By exploiting the computing power and local data of distributed clients, federated learning (FL) features ubiquitous properties such as reduction of communication overhead and preserving data privacy. In each communication round of FL, the clients update local models based on their own

federated learning client scheduling multi-armed bandit wireless channel performance regret

发现论文，激发创造

个性化联邦学习的高效群集选择：一种多臂赌博机方法

本文介绍了一种受多臂赌博机方法启发的动态上界置信度算法 (dUCB)，以解决个性化联邦学习中用户聚类的复杂性问题，特别在动态网络中，该算法平衡了探索与利用，使新用户能够有效地找到适合其数据分布的最佳聚类，并在各种情况下评估了算法的性能，展示了其在处理动态联邦学习场景中的有效性。

Oct, 2023

联邦多臂老虎机

这篇论文提出了联邦多臂老虎机的新模型，并研究了两个具体的联邦多臂老虎机模型，提出了 Federated Double UCB 方法用于解决两个模型，理论与实验结果表明了该算法的效果和高效性。

Jan, 2021

基于贝叶斯相对误差策略的联邦学习通信效率增强客户端选择方法

本文提出了一种基于赌博机的通信高效客户端选择策略 UCB-CS，其通过降低通信开销来实现更快的收敛速度，并展示了客户端选择如何用于提高公平性。

Dec, 2020

不确定信道下的联邦学习：客户端调度与资源分配

本文提出了一种联合客户端调度和资源块分配策略，通过利用高斯过程回归（GPR）的无线信道预测方法和 Lyapunov 优化框架，可以减少在不完美信道情况下联邦学习（FL）的准确性损失。通过数值模拟，在完美和不完美 CSI 下，实验表明该方法可以将准确性损失降低到 25.8％以下，相对于现有的客户端调度和 RB 分配方法的优化效果得到了很好的验证。

Feb, 2020

从学习到分析：通过目标导向的客户选择提高模型效能

通过闭环模型分析框架，我们提出了一种解决基于模型分析框架的目标导向客户选择问题的算法，并推导出了所提算法的两个遗憾上界，数值结果表明所提算法表现接近最优。

Mar, 2024

个性化联邦多臂老虎机

提出了个性化联邦多臂老虎机 (PF-MAB) 的总体框架，研究了一个灵活平衡泛化和个性化的混合老虎机学习问题，并提出了个性化联邦上置信上界 (PF-UCB) 算法，在理论分析和实验方面都取得了良好效果。

Feb, 2021

基于 MAB 的不确定资源移动网络联邦学习客户端选择

本文提出了一种针对联邦学习（FL）客户端不能评估计算和通信资源的客户端选择方法，该方法使用移动客户端的丰富数据和计算资源训练机器学习（ML）模型，而无需在集中式系统中收集其数据。

Sep, 2020

无线网络联邦学习的调度策略

本文基于一个分析模型，研究了联邦学习在无线网络中的性能表现和调度策略，并发现在高信噪比下使用比例公平调度策略会比随机调度和轮询调度策略更有效，而在低信噪比下轮询调度策略更为可取。同时发现了更新参数的压缩和量化在提高联邦学习收敛速度方面的重要性，并揭示了在可用频谱量不变的情况下调度的用户数和子信道带宽之间的权衡关系。

Aug, 2019

无线联邦学习中快速收敛的设备调度

本文以联邦学习为背景，提出一种联合带宽分配和设备调度问题的解决方案，该方案通过一个贪心算法和运行时间预算中定向分配宽带的优化模型实现，从而在模型精度和训练时间预算方面实现了最好的性能表现。

Nov, 2019

异步上置信区间算法用于联邦线性赌臂机

本文旨在探索线性上下文强化学习在联邦学习环境下的应用，提出了一种基于异步模型更新和通信的通用框架，并对分布式学习下的遗憾和通信成本进行了理论分析，并进行了广泛的实证评估，证明了该解决方案的有效性。

Oct, 2021