Sep, 2023

隐私工程化价值分解网络用于合作多智体强化学习

TL;DR在合作多智能体强化学习(Co-MARL)中,我们提出了一种隐私工程化的价值分解网络(PE-VDN)算法来建模多智能体间的协作且可确保各智能体的环境交互数据的机密性,通过整合分布式计算方案、隐私保护的多方计算协议和差分隐私技术,PE-VDN 在保证有效的隐私保护水平的同时实现了高达 Vanilla VDN 80% 的胜率。