激励诚实通信对于联邦赌博机的应用

ICLRFeb, 2024

激励诚实通信对于联邦赌博机的应用

Incentivized Truthful Communication for Federated Bandits

Zhepei Wei, Chuanhao Li, Tianze Ren, Haifeng Xu, Hongning Wang

TL;DR通过提出名为 Truth-FedBan 的激励兼容（即真实性）通信协议，本文首次展示了在联邦赌博学习中同时实现激励兼容性和近乎最优的遗憾的可能性。大量的数值研究进一步验证了我们提出的解决方案的有效性。

Abstract

To enhance the efficiency and practicality of federated bandit learning, recent advances have introduced incentives to motivate communication among clients, where a client participates only when the incentive offered by the server outweighs its participation cost. However, existing

federated bandit learning incentive mechanisms strategic clients communication protocol optimal regret

发现论文，激发创造

激励通信的联邦赌博机

在联邦赌博学习的研究中，为了处理自我利益的客户，我们引入了一种激励通信问题，提出了一种名为 Inc-FedUCB 的激励通信协议，它在可证明的通信和激励成本保证下实现了接近最优的遗憾率。通过对合成和真实世界数据集的广泛实验进一步验证了该方法的有效性。

Sep, 2023

基于贝叶斯相对误差策略的联邦学习通信效率增强客户端选择方法

本文提出了一种基于赌博机的通信高效客户端选择策略 UCB-CS，其通过降低通信开销来实现更快的收敛速度，并展示了客户端选择如何用于提高公平性。

Dec, 2020

基于随机客户端参与的无偏联邦学习激励机制设计

本文提出了一种基于博弈论的激励机制，通过随机客户端参与度数，实现以不偏差的方式获得高性能模型，并分析了客户端的参与度数和异质性数据如何影响模型性能的收敛界。

Apr, 2023

高效沟通的联邦非线性赌博机优化

我们提出了一种名为 Fed-GO-UCB 的新算法，用于具有通用非线性目标函数的联邦赌博优化问题，通过严格证明，Fed-GO-UCB 能够以次线性速率实现累积遗憾和通信成本。

Nov, 2023

事实还是虚构：诚实机制能否消除联合式自由骑车现象？

以解决标准联邦学习中的共享问题为目标，提出了 FACT 机制，该机制通过使用惩罚系统来消除联邦问题，并通过创建竞争环境确保代理提供真实信息，同时通过提供比单独训练更好的性能来鼓励代理参与，实证结果显示 FACT 在代理不真实情景下避免了共享问题，并将代理损失减少了 4 倍以上。

May, 2024

面向众包数据标注的联邦学习诚实激励机制

本文研究了在联邦学习中使用众包数据标注的问题，考虑了客户端的策略性行为，设计了能够激励客户端诚实行为的机制，并在实验中评估了该机制的性能。

Jan, 2023

提高群体诚实度的机制

本论文考虑如何设计一种激励机制，以在固有的逆向选择环境下，利用纯粹的协作或对抗以及报告代价获得真实从众意见汇报。

Jan, 2014

更接近现实：带有不完美通信的协同 Bandit 算法

本文探讨了协作强盗问题在现实世界通信环境下的三种典型情景，并提出了相应的去中心化算法来实现可比性能并且保证产生小组遗憾次数接近最优解，同时提出了对于完美通信情况下的改进算法，最后给出了群体遗憾的最紧密的网络相关极小极大下限。

Nov, 2021

风险厌恶参与反馈下的联邦学习目标导向通信

本文研究了基于联邦学习（FL）的客户端选择问题，考虑了参与者的风险规避性质，提出了一种面向目标的通信问题，用于获得具有高通信效率的性能。它可用于制定本地传输策略，从而提高传输效率，并通过处理 PS 反馈，并评估其在培训学习模型方面的贡献，从而降低设备间的连接数。模拟结果表明，相较于基线方案，该方法最多可以提高 1.4 倍的通信链路利用率。

May, 2023

双重对抗联合赌博机

研究具有多个代理通过通信网络合作的新的非随机联邦多臂老虎机问题，其中危害的损失是由特指所有代理的每个时间步长和每个代理的每个手臂的损失的笨拙对手分配的。对于任何联邦老虎机算法，根据不同的设置提供遗憾下限，当代理有完整信息反馈或老虎机反馈时。在老虎机反馈设置下，提出一种接近最优的联邦老虎机算法 FEDEXP3，证明 FEDEXP3 可以保证不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。还提供我们算法的数值评估以验证我们的理论结果，并证明其在合成和现实世界数据集上的有效性。

Jan, 2023