BriefGPT.xyz
Ask
alpha
关键词
federated multi-armed bandits
搜索结果 - 2
联邦多臂赌博机的奖励训练
本文提出了一种名为奖励教学的新颖概念,其中服务器通过隐式本地奖励调整来指导客户端向全局最优性靠拢。对于客户端无法修改现有协议的情况,作者提出了一种名为 Teaching-After-Learning(TAL) 的逐步方法,并通过开发技术方法
→
PDF
a year ago
AAAI
联邦多臂老虎机
这篇论文提出了联邦多臂老虎机的新模型,并研究了两个具体的联邦多臂老虎机模型,提出了 Federated Double UCB 方法用于解决两个模型,理论与实验结果表明了该算法的效果和高效性。
PDF
3 years ago
Prev
Next