ICMLJul, 2023

隐秘行动:利用差分隐私噪音来抵御局部篡改攻击

TL;DR该研究提出了基于不同隐私的多智能体强化学习中的本地化污染攻击(PeLPA),针对其存在的毒化威胁,采用隐私利用技术和逃避鲁棒性技术,利用 DP 差分隐私 的噪音规避异常检测系统,阻碍模型的最优收敛。实验结果表明,在 20% 和 40% 的攻击比率下,PeLPA 攻击会使平均步数增加 50.69%和 64.41%,同时会导致最优奖励获得时间的 1.4 倍和 1.6 倍的计算时间增加,以及 20% 和 40%攻击比率下收敛速度分别变慢 1.18 倍和 1.38 倍。