联邦式最佳臂识别中几乎零成本的通信

AAAIAug, 2022

联邦式最佳臂识别中几乎零成本的通信

Almost Cost-Free Communication in Federated Best Arm Identification

Kota Srinivas Reddy, P. N. Karthik, Vincent Y. F. Tan

TL;DR本研究基于联邦学习多臂赌博机模型，在中心服务器和多个客户端之间定义了本地和全局最佳臂的概念，并提出了一种名为 FedElim 的新算法，以最小化总成本，其中总成本是所有客户处进行的臂数的总数和通信成本的总和，同时满足误差概率的上限约束。

Abstract

We study the problem of best arm identification in a federated learning multi-armed bandit setup with a central server and multiple clients. Each client is associated with a →

federated learning multi-armed bandit local best arm global best arm communication cost

发现论文，激发创造

利用异质性进行鲁棒联邦最佳臂识别

本研究针对联邦多臂赌博问题提出了 Fed-SEL 算法，基于连续淘汰技术和本地抽样步骤，通过研究多臂赌博分布之间的异质性，发现 Fed-SEL 在降低样本和通信复杂度方面具有较高效率，且在存在拜占廷客户端的环境中，可部署到联邦和点对点设置中。

Sep, 2021

双重对抗联合赌博机

研究具有多个代理通过通信网络合作的新的非随机联邦多臂老虎机问题，其中危害的损失是由特指所有代理的每个时间步长和每个代理的每个手臂的损失的笨拙对手分配的。对于任何联邦老虎机算法，根据不同的设置提供遗憾下限，当代理有完整信息反馈或老虎机反馈时。在老虎机反馈设置下，提出一种接近最优的联邦老虎机算法 FEDEXP3，证明 FEDEXP3 可以保证不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。还提供我们算法的数值评估以验证我们的理论结果，并证明其在合成和现实世界数据集上的有效性。

Jan, 2023

联邦组合多智能体多臂赌博机

该论文介绍了一个用于在线组合优化和有限带反馈的联邦学习框架，该框架将任何具有复杂度为 O (psi/epsilon^beta)（其中省略了对数计算，psi 是一个函数，beta 是常数）的离线单代理（alpha-epsilon）逼近算法转化为具有 m 个通信代理和 alpha 遗憾度的在线多代理算法，并保证了与时间跨度 T 的次线性增长，且随着通信代理数量的增加而线性加速。此外，该算法还具有高效的通信特性，只需要亚线性数量的通信轮次，通过将该框架成功应用于在线随机子模块最大化，并实现了第一个单代理和多代理设置的结果，以及恢复了专门的单代理理论保证。我们还通过对随机数据摘要问题的实证验证来展示所提出的框架的有效性，即使在单代理场景中也是如此。

May, 2024

多层次最优臂识别

在本文中，我们研究多信度最佳臂识别问题，通过提出一种以梯度为基础的方法，我们找到了具有渐近最优成本复杂度的解决方案，并针对每个臂还提出了最优保真度的概念。

Jun, 2024

有限互动的协同学习：多臂赌博机分布式探索的严谨界限

研究多臂老虎机中多智能体协作学习，旨在探讨在交互受限制即沟通成本高昂的情况下，协作学习的效率与集中式算法的比较，提出多个新技术，对时间或置信度限制下的通信步数的下限问题进行了更加深入的分析。

Apr, 2019

多臂赌博机中最优臂选取的顺序消除算法

研究了多臂赌博机中的最佳臂辨识问题，提出了一个基于顺序淘汰算法的通用框架，并基于采样机制和每轮淘汰臂数量提出了性能评估指标，设计了一种按剩余臂数的非线性函数划分预算的算法，能够在纯探索场景下获得改进的理论保证和实验性能。

Sep, 2016

联邦多臂老虎机

这篇论文提出了联邦多臂老虎机的新模型，并研究了两个具体的联邦多臂老虎机模型，提出了 Federated Double UCB 方法用于解决两个模型，理论与实验结果表明了该算法的效果和高效性。

Jan, 2021

异步联邦赌臂纯探索

我们研究了多臂赌博机和线性赌博机的联邦纯探索问题，在该问题中， M 个代理通过与中央服务器通信来合作地识别最佳臂。为了增强算法对延迟和代理不可用性的鲁棒性，我们提出了第一个用于固定置信度的联邦异步多臂赌博机和线性赌博机算法。我们的理论分析表明，所提出的算法在完全异步环境中实现了接近最优的样本复杂度和高效的通信成本。此外，基于合成和现实世界数据的实验结果从经验上阐明了所提出算法的有效性和通信成本效益。

Oct, 2023

关于最佳臂识别的最优样本复杂度

研究最优臂辨识问题，发现新算法和上下限优化，并提出一个新的关于最优样本复杂度的猜想。

Nov, 2015

拜占庭攻击下的联邦多臂老虎机

本文研究了存在拜占庭攻击的联邦多臂老虎机问题，并借鉴了鲁棒统计学中的方法提出了一种名为 Fed-MoM-UCB 的估算器，通过实验证明了其在面对拜占庭攻击时的有效性。

May, 2022