隐秘行动：利用差分隐私噪音来抵御局部篡改攻击

ICMLJul, 2023

隐秘行动：利用差分隐私噪音来抵御局部篡改攻击

Hiding in Plain Sight: Differential Privacy Noise Exploitation for Evasion-resilient Localized Poisoning Attacks in Multiagent Reinforcement Learning

PDF

Md Tamjid Hossain, Hung La

TL;DR该研究提出了基于不同隐私的多智能体强化学习中的本地化污染攻击（PeLPA），针对其存在的毒化威胁，采用隐私利用技术和逃避鲁棒性技术，利用 DP 差分隐私的噪音规避异常检测系统，阻碍模型的最优收敛。实验结果表明，在 20% 和 40% 的攻击比率下，PeLPA 攻击会使平均步数增加 50.69％和 64.41％，同时会导致最优奖励获得时间的 1.4 倍和 1.6 倍的计算时间增加，以及 20% 和 40％攻击比率下收敛速度分别变慢 1.18 倍和 1.38 倍。

Abstract

Lately, differential privacy (DP) has been introduced in cooperative multiagent reinforcement learning (CMARL) to safeguard the agents' privacy against adversarial inference during knowledge sharing. Nevertheless, we argue that the noise introduced by DP mechanisms may inadvertently gi

differential privacy cooperative multiagent reinforcement learning privacy-exploiting localized poisoning attack anomaly detection

发现论文，激发创造

离线多智能体强化学习中的奖励污染攻击

本研究探讨了多智能体强化学习中的奖励毒化攻击，并展示了攻击者可以安装目标策略作为马尔科夫完美主导策略均衡，从而使得理性代理人会跟随攻击者所预期的策略走向。该攻击可以更便捷地实施，也适用于多种不同结构的数据集和 MARL 代理算法，我们同时还研究了数据集结构和攻击代价之间的关系与防御方法。

Jun, 2022

具有自我对弈的差分隐私强化学习

我们研究了具有差分隐私约束的多智能体强化学习问题，设计了一种基于乐观纳什值迭代和 Bernstein 型奖励的算法，能满足 JDP 和 LDP 的要求，并提供了关于后悔界的推广结果，是对多智能体强化学习中轨迹隐私保护的首批研究。

Apr, 2024

针对差分隐私的攻击感知噪声校准

我们的研究提出了一种新方法，通过直接校准噪声规模到期望的攻击风险水平，而无需选择隐私预算参数 ε，从而显著降低噪声规模，提高模型的准确性，同时保护隐私。

Jul, 2024

DPAdapter：通过噪声容忍预训练改进差分隐私深度学习

DPAdapter 是一种创新技术，通过增强参数的稳健性，提高了差分隐私机器学习算法的模型性能。实验证明，使用 DPAdapter 结合现有的 DPML 算法可以显著提高其平均准确率，从 72.92% 提升至 77.09%，并保持一个隐私预算 ε=4。

Mar, 2024

DPMAC：针对合作多智能体强化学习的差分隐私通信

提出了一种差分隐私的多智能体通信 (DPMAC) 算法用于多智能体强化学习中，该算法通过为每个智能体配备具有严格 (ε, δ)- 差分隐私保证的本地消息发送器来保护个体智能体的敏感信息，并在合作性多智能体强化学习中证明了纳什均衡 (Nash equilibrium) 的存在，从而表明该问题是可以在博弈理论层面上学习的。通过大量实验证明了 DPMAC 在隐私保护场景中相对于基准方法的明显优势。

Aug, 2023

在线多智能体强化学习的高效对抗攻击

本文研究了敌对攻击对多智能体强化学习模型的影响，针对可改变奖励和可操纵动作的两类敌对攻击方式进行了限制，并引入一种混合攻击策略，证明了该攻击策略可以有效地攻击多智能体强化学习代理。

Jul, 2023

隐私意识智能体中的群体决策

如何在个人的隐私需求和安全顾虑中实现个体之间的信息交流以彼此学习？通过采用严格的统计担保，基于差分隐私（DP）控制信息泄露，我们使得保护个人隐私和实现高效社会学习成为可能。我们的研究结果揭示了在质量、学习准确性、通信成本和个体隐私保护水平之间在有限和无限信号环境下的权衡性质。

Feb, 2024

离线强化学习中的奖励污染攻击

我们研究了利用深度神经网络进行函数逼近的一般离线强化学习中奖励污染攻击问题。我们提出了一种名为 `策略对比攻击` 的攻击策略，通过使一些低性能策略看起来像高性能策略，同时使高性能策略看起来像低性能策略来进行攻击。据我们所知，这是首个在一般离线强化学习环境中提出的黑盒奖励污染攻击。我们在攻击设计上提供了理论洞察，并通过在不同类型的学习数据集上实证表明我们的攻击对当前最先进的离线强化学习算法有效。

Feb, 2024

近似最优差分隐私强化学习

本研究提出一种基于差分隐私约束条件的在线探索强化学习算法，该算法达到了非隐私算法的信息理论下限，同时利用隐私发布噪音技术获得了隐私保护，解决了个性化医疗等隐私数据应用中数据使用安全的问题。

Dec, 2022

环境毒化的策略教学：针对强化学习的训练时对抗性攻击

本研究探讨了加强学习中的一种安全威胁，其中攻击者污染学习环境以强制代理执行攻击者选择的目标策略，提出了一个寻找不同攻击成本度量的 “最优隐蔽攻击” 的优化框架，并在两种环境（离线和在线）中实例化了攻击，揭示加强学习算法面临的重大安全威胁。

Mar, 2020