Jan, 2019

联邦深度强化学习

TL;DR本文提出了一种新的深度强化学习框架 FedRL,旨在联邦地建立高质量的代理模型,其中考虑到其隐私,并通过利用高斯微分来保护数据和模型的隐私。在 Grid-world 和 Text2Action 领域的实验中,该框架与各种基线模型进行了比较。