Oct, 2023

通过 ADMM 基于梯度更新的方法提高联邦自然策略梯度的通信效率

TL;DR联邦强化学习通过 ADMM 方法有效降低通信复杂性,实现了与标准联邦自然策略梯度相同的收敛速度。