Sep, 2024
具有灵活个性化的联邦$\mathcal{X}$-臂赌博机
Federated $\mathcal{X}$-armed Bandit with Flexible Personalisation
TL;DR本文提出了一种在$\mathcal{X}$-臂赌博机框架下进行个性化联邦学习的新方法,旨在解决在高度异质环境中优化本地与全局目标的挑战。我们的方法通过结合个别客户偏好与聚合的全球知识的代理目标函数,灵活权衡个性化与集体学习。理论分析与实证评估表明,相较于现有方法,我们的方法表现出优越性,具有广泛的应用潜力。