ICMLMay, 2023

联邦 Q 学习中异构的优点:线性加速及其它

TL;DR该论文讨论了利用分布式数据进行在线学习时,采用联邦 Q 学习算法可以在不共享数据的情况下进行合作学习,提出了一种基于重要性加权的平均算法,加速了算法的收敛速度,降低了样本复杂度。