点对点网络中线性赌博机的分布式聚类

ICMLApr, 2016

点对点网络中线性赌博机的分布式聚类

Distributed Clustering of Linear Bandits in Peer to Peer Networks

Nathan Korda, Balazs Szorenyi, Shuai Li

TL;DR本论文提出了两种分布式置信球算法，用于解决具有有限通信能力的对等网络中的线性赌博问题。这两种算法通过实验在多个真实数据集上证明了其相对于最先进技术的性能表现。

Abstract

We provide two distributed confidence ball algorithms for solving linear bandit problems in peer to peer networks with limited communication capabilities. For the first, we assume that all the peers are solving the same linear bandit problem, and prove that our algorithm achieves the o

distributed algorithms peer to peer networks linear bandit problems asymptotic regret rate cluster discovery

发现论文，激发创造

聚类多智能体线性赌博

研究了多智能体线性随机赌博问题的特定情况，称为聚类的多智能体线性赌博。提出了一种新颖的算法，在多个智能体之间有效合作以加快整体优化问题。通过在合成数据和真实数据上与最先进的算法进行经验评估，理论分析了后悔最小化问题和聚类质量，证明了我们方法的有效性：我们的算法显著改善了后悔最小化，并成功恢复了真实的聚类划分。

Sep, 2023

异步上置信区间算法用于联邦线性赌臂机

本文旨在探索线性上下文强化学习在联邦学习环境下的应用，提出了一种基于异步模型更新和通信的通用框架，并对分布式学习下的遗憾和通信成本进行了理论分析，并进行了广泛的实证评估，证明了该解决方案的有效性。

Oct, 2021

在线集群化的赌博机

介绍一种基于自适应聚类探索 - 利用 (“赌徒”) 策略的内容推荐算法，提供标准随机噪声环境下的尖锐遗憾分析，证明其伸缩性属性并在一些人工和实际数据集上证明其有效性。实验结果显示，在赌徒问题上，预测性能显著优于现有技术方法。

Jan, 2014

合作多智能体赌博机：优化个体懊悔并具有恒定通讯开销的分布式算法

合作多智能体多臂赌博算法中的通信策略，既实现了最优个体遗憾，又具有恒定的通信成本。

Aug, 2023

异步联邦赌臂纯探索

我们研究了多臂赌博机和线性赌博机的联邦纯探索问题，在该问题中， M 个代理通过与中央服务器通信来合作地识别最佳臂。为了增强算法对延迟和代理不可用性的鲁棒性，我们提出了第一个用于固定置信度的联邦异步多臂赌博机和线性赌博机算法。我们的理论分析表明，所提出的算法在完全异步环境中实现了接近最优的样本复杂度和高效的通信成本。此外，基于合成和现实世界数据的实验结果从经验上阐明了所提出算法的有效性和通信成本效益。

Oct, 2023

拜占庭鲁棒联邦线性赌博机

研究在联邦学习环境下的线性赌博机优化问题，提出一个具有鲁棒聚合神谕的新算法，证明该算法对少于一半的代理进行拜占庭攻击是鲁棒的，并通过基于树的机制使算法具有差分隐私。如果已知污染程度较小，则使用平均几何中位数神谕来进行鲁棒聚合进一步改善遗憾界。

Apr, 2022

差分隐私联合线性赌博机算法

本文就基于上下文线性赌博机的联邦学习问题提出了一种称为 FedUCB 的多代理私有算法，该算法在中央化和去中心化（点对点）联邦学习方案中均可使用，在保证通信隐私的同时，在后遗憾度和隐私保证方面表现出极强的实用性。

Oct, 2020

联邦线性情境赌博机

本文提出了一种新型的联邦线性情境赌博机模型 Fed-PE，并采用协作算法来处理客户端的异质性，它基于新颖的多客户 G - 最优设计，并通过对不相交和共享参数情况下的对数通信成本，实现了几乎最优的遗憾。此外，本文还引入了一种新的概念 —— 共线依赖策略，并基于此导出了不相交参数情况下的严格极小化遗憾下界。实验结果表明，该算法在合成和真实数据集上均具有很好的鲁棒性。

Oct, 2021

异质客户的联邦线性情境赌博机

提出了一种面向异构客户的联邦赌博学习算法，通过对客户进行聚类实现了协同赌博学习，在联邦学习设置下，该算法在所有客户端都能实现非平凡的次线性遗憾和通信成本，只要服务器在任何时候只共享一个模型。

Feb, 2024

在线赌博游戏聚类算法的改进

本研究提出了一种在线聚类的赌博算法，通过允许用户频率的非统一分布，并使用简单的集合结构来表示聚类，提出了一种更有效的算法，并证明了该算法的遗憾界可以不考虑用户的最小频率。在合成和真实数据集的实验中，新算法相对于现有方法具有一定的优势。

Feb, 2019