激励诚实通信对于联邦赌博机的应用
在联邦赌博学习的研究中,为了处理自我利益的客户,我们引入了一种激励通信问题,提出了一种名为 Inc-FedUCB 的激励通信协议,它在可证明的通信和激励成本保证下实现了接近最优的遗憾率。通过对合成和真实世界数据集的广泛实验进一步验证了该方法的有效性。
Sep, 2023
本文提出了一种基于赌博机的通信高效客户端选择策略 UCB-CS,其通过降低通信开销来实现更快的收敛速度,并展示了客户端选择如何用于提高公平性。
Dec, 2020
本文提出了一种基于博弈论的激励机制,通过随机客户端参与度数,实现以不偏差的方式获得高性能模型,并分析了客户端的参与度数和异质性数据如何影响模型性能的收敛界。
Apr, 2023
我们提出了一种名为 Fed-GO-UCB 的新算法,用于具有通用非线性目标函数的联邦赌博优化问题,通过严格证明,Fed-GO-UCB 能够以次线性速率实现累积遗憾和通信成本。
Nov, 2023
以解决标准联邦学习中的共享问题为目标,提出了 FACT 机制,该机制通过使用惩罚系统来消除联邦问题,并通过创建竞争环境确保代理提供真实信息,同时通过提供比单独训练更好的性能来鼓励代理参与,实证结果显示 FACT 在代理不真实情景下避免了共享问题,并将代理损失减少了 4 倍以上。
May, 2024
本文探讨了协作强盗问题在现实世界通信环境下的三种典型情景,并提出了相应的去中心化算法来实现可比性能并且保证产生小组遗憾次数接近最优解,同时提出了对于完美通信情况下的改进算法,最后给出了群体遗憾的最紧密的网络相关极小极大下限。
Nov, 2021
本文研究了基于联邦学习(FL)的客户端选择问题,考虑了参与者的风险规避性质,提出了一种面向目标的通信问题,用于获得具有高通信效率的性能。它可用于制定本地传输策略,从而提高传输效率,并通过处理 PS 反馈,并评估其在培训学习模型方面的贡献,从而降低设备间的连接数。模拟结果表明,相较于基线方案,该方法最多可以提高 1.4 倍的通信链路利用率。
May, 2023
研究具有多个代理通过通信网络合作的新的非随机联邦多臂老虎机问题,其中危害的损失是由特指所有代理的每个时间步长和每个代理的每个手臂的损失的笨拙对手分配的。对于任何联邦老虎机算法,根据不同的设置提供遗憾下限,当代理有完整信息反馈或老虎机反馈时。在老虎机反馈设置下,提出一种接近最优的联邦老虎机算法 FEDEXP3,证明 FEDEXP3 可以保证不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。还提供我们算法的数值评估以验证我们的理论结果,并证明其在合成和现实世界数据集上的有效性。
Jan, 2023