个性化联邦多臂赌博机

Oct, 2023

Personalized Federated X -armed Bandit

Wenjie Li, Qifan Song, Jean Honorio

TL;DR本研究通过提出的 PF-PNE 算法，同时优化异构客户端的个性化联邦学习目标，通过特殊的双重淘汰策略安全地消除非最优区域，并通过有偏但有效的本地目标评估鼓励联邦合作。该算法能够处理任意程度的异构性，有限的通信保护客户端奖励数据的机密性。理论分析证明了该算法相比单个客户端算法的优势，实验结果表明 PF-PNE 在合成和真实数据集上优于多个基准算法。

Abstract

In this work, we study the personalized federated $\mathcal{X}$-armed bandit problem, where the heterogeneous local objectives of the clients are optimized simultaneously in the federated learning paradigm. We propose the \texttt{PF-PNE} algorithm with a unique →

personalized federated learning double elimination strategy federated collaboration local objectives confidentiality

发现论文，激发创造

个性化联邦多臂老虎机

提出了个性化联邦多臂老虎机 (PF-MAB) 的总体框架，研究了一个灵活平衡泛化和个性化的混合老虎机学习问题，并提出了个性化联邦上置信上界 (PF-UCB) 算法，在理论分析和实验方面都取得了良好效果。

Feb, 2021

联邦线性情境赌博机

本文提出了一种新型的联邦线性情境赌博机模型 Fed-PE，并采用协作算法来处理客户端的异质性，它基于新颖的多客户 G - 最优设计，并通过对不相交和共享参数情况下的对数通信成本，实现了几乎最优的遗憾。此外，本文还引入了一种新的概念 —— 共线依赖策略，并基于此导出了不相交参数情况下的严格极小化遗憾下界。实验结果表明，该算法在合成和真实数据集上均具有很好的鲁棒性。

Oct, 2021

双重对抗联合赌博机

研究具有多个代理通过通信网络合作的新的非随机联邦多臂老虎机问题，其中危害的损失是由特指所有代理的每个时间步长和每个代理的每个手臂的损失的笨拙对手分配的。对于任何联邦老虎机算法，根据不同的设置提供遗憾下限，当代理有完整信息反馈或老虎机反馈时。在老虎机反馈设置下，提出一种接近最优的联邦老虎机算法 FEDEXP3，证明 FEDEXP3 可以保证不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。还提供我们算法的数值评估以验证我们的理论结果，并证明其在合成和现实世界数据集上的有效性。

Jan, 2023

异质客户的联邦线性情境赌博机

提出了一种面向异构客户的联邦赌博学习算法，通过对客户进行聚类实现了协同赌博学习，在联邦学习设置下，该算法在所有客户端都能实现非平凡的次线性遗憾和通信成本，只要服务器在任何时候只共享一个模型。

Feb, 2024

联邦组合多智能体多臂赌博机

该论文介绍了一个用于在线组合优化和有限带反馈的联邦学习框架，该框架将任何具有复杂度为 O (psi/epsilon^beta)（其中省略了对数计算，psi 是一个函数，beta 是常数）的离线单代理（alpha-epsilon）逼近算法转化为具有 m 个通信代理和 alpha 遗憾度的在线多代理算法，并保证了与时间跨度 T 的次线性增长，且随着通信代理数量的增加而线性加速。此外，该算法还具有高效的通信特性，只需要亚线性数量的通信轮次，通过将该框架成功应用于在线随机子模块最大化，并实现了第一个单代理和多代理设置的结果，以及恢复了专门的单代理理论保证。我们还通过对随机数据摘要问题的实证验证来展示所提出的框架的有效性，即使在单代理场景中也是如此。

May, 2024

利用异质性进行鲁棒联邦最佳臂识别

本研究针对联邦多臂赌博问题提出了 Fed-SEL 算法，基于连续淘汰技术和本地抽样步骤，通过研究多臂赌博分布之间的异质性，发现 Fed-SEL 在降低样本和通信复杂度方面具有较高效率，且在存在拜占廷客户端的环境中，可部署到联邦和点对点设置中。

Sep, 2021

联邦多臂老虎机

这篇论文提出了联邦多臂老虎机的新模型，并研究了两个具体的联邦多臂老虎机模型，提出了 Federated Double UCB 方法用于解决两个模型，理论与实验结果表明了该算法的效果和高效性。

Jan, 2021

FedConPE：具有异构客户端的高效联邦对话赌博

FedConPE 是一种基于相位消除的联邦对话贪心算法，通过与中央服务器的协作来解决全局上下文线性贪心问题，并确保数据的安全管理。FedConPE 能够以增强的计算和通信效率以及升级的隐私保护方式，优于现有的对话贪心算法，并且使用更少的对话次数。

May, 2024

异步联邦赌臂纯探索

我们研究了多臂赌博机和线性赌博机的联邦纯探索问题，在该问题中， M 个代理通过与中央服务器通信来合作地识别最佳臂。为了增强算法对延迟和代理不可用性的鲁棒性，我们提出了第一个用于固定置信度的联邦异步多臂赌博机和线性赌博机算法。我们的理论分析表明，所提出的算法在完全异步环境中实现了接近最优的样本复杂度和高效的通信成本。此外，基于合成和现实世界数据的实验结果从经验上阐明了所提出算法的有效性和通信成本效益。

Oct, 2023

个性化联邦学习的高效群集选择：一种多臂赌博机方法

本文介绍了一种受多臂赌博机方法启发的动态上界置信度算法 (dUCB)，以解决个性化联邦学习中用户聚类的复杂性问题，特别在动态网络中，该算法平衡了探索与利用，使新用户能够有效地找到适合其数据分布的最佳聚类，并在各种情况下评估了算法的性能，展示了其在处理动态联邦学习场景中的有效性。

Oct, 2023