IJCAIAug, 2023

DPMAC:针对合作多智能体强化学习的差分隐私通信

TL;DR提出了一种差分隐私的多智能体通信 (DPMAC) 算法用于多智能体强化学习中,该算法通过为每个智能体配备具有严格 (ε, δ)- 差分隐私保证的本地消息发送器来保护个体智能体的敏感信息,并在合作性多智能体强化学习中证明了纳什均衡 (Nash equilibrium) 的存在,从而表明该问题是可以在博弈理论层面上学习的。通过大量实验证明了 DPMAC 在隐私保护场景中相对于基准方法的明显优势。