联邦式最佳臂识别中几乎零成本的通信
本研究针对联邦多臂赌博问题提出了 Fed-SEL 算法,基于连续淘汰技术和本地抽样步骤,通过研究多臂赌博分布之间的异质性,发现 Fed-SEL 在降低样本和通信复杂度方面具有较高效率,且在存在拜占廷客户端的环境中,可部署到联邦和点对点设置中。
Sep, 2021
研究具有多个代理通过通信网络合作的新的非随机联邦多臂老虎机问题,其中危害的损失是由特指所有代理的每个时间步长和每个代理的每个手臂的损失的笨拙对手分配的。对于任何联邦老虎机算法,根据不同的设置提供遗憾下限,当代理有完整信息反馈或老虎机反馈时。在老虎机反馈设置下,提出一种接近最优的联邦老虎机算法 FEDEXP3,证明 FEDEXP3 可以保证不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。还提供我们算法的数值评估以验证我们的理论结果,并证明其在合成和现实世界数据集上的有效性。
Jan, 2023
该论文介绍了一个用于在线组合优化和有限带反馈的联邦学习框架,该框架将任何具有复杂度为 O (psi/epsilon^beta)(其中省略了对数计算,psi 是一个函数,beta 是常数)的离线单代理(alpha-epsilon)逼近算法转化为具有 m 个通信代理和 alpha 遗憾度的在线多代理算法,并保证了与时间跨度 T 的次线性增长,且随着通信代理数量的增加而线性加速。此外,该算法还具有高效的通信特性,只需要亚线性数量的通信轮次,通过将该框架成功应用于在线随机子模块最大化,并实现了第一个单代理和多代理设置的结果,以及恢复了专门的单代理理论保证。我们还通过对随机数据摘要问题的实证验证来展示所提出的框架的有效性,即使在单代理场景中也是如此。
May, 2024
研究多臂老虎机中多智能体协作学习,旨在探讨在交互受限制即沟通成本高昂的情况下,协作学习的效率与集中式算法的比较,提出多个新技术,对时间或置信度限制下的通信步数的下限问题进行了更加深入的分析。
Apr, 2019
研究了多臂赌博机中的最佳臂辨识问题,提出了一个基于顺序淘汰算法的通用框架,并基于采样机制和每轮淘汰臂数量提出了性能评估指标,设计了一种按剩余臂数的非线性函数划分预算的算法,能够在纯探索场景下获得改进的理论保证和实验性能。
Sep, 2016
这篇论文提出了联邦多臂老虎机的新模型,并研究了两个具体的联邦多臂老虎机模型,提出了 Federated Double UCB 方法用于解决两个模型,理论与实验结果表明了该算法的效果和高效性。
Jan, 2021
我们研究了多臂赌博机和线性赌博机的联邦纯探索问题,在该问题中, M 个代理通过与中央服务器通信来合作地识别最佳臂。为了增强算法对延迟和代理不可用性的鲁棒性,我们提出了第一个用于固定置信度的联邦异步多臂赌博机和线性赌博机算法。我们的理论分析表明,所提出的算法在完全异步环境中实现了接近最优的样本复杂度和高效的通信成本。此外,基于合成和现实世界数据的实验结果从经验上阐明了所提出算法的有效性和通信成本效益。
Oct, 2023
本文研究了存在拜占庭攻击的联邦多臂老虎机问题,并借鉴了鲁棒统计学中的方法提出了一种名为 Fed-MoM-UCB 的估算器,通过实验证明了其在面对拜占庭攻击时的有效性。
May, 2022