Oct, 2023

无线联邦策略梯度

TL;DR提出了一种通过无线信道共享本地信息并使用接收到的聚合波形来更新策略参数的无线联合策略梯度算法,并研究了噪声和信道失真对算法收敛性的影响,确定了通信和采样的复杂度以找到一个近似稳定点,并通过模拟结果展示了算法的有效性。