Sep, 2024

针对合作多智能体深度强化学习的时空隐秘后门攻击

TL;DR本研究针对合作多智能体深度强化学习(c-MADRL)中存在的后门攻击问题,提出了一种新型时空隐秘后门攻击方法。该方法通过在单个智能体中嵌入攻击触发,利用对抗时空行为模式作为后门触发器,并逆向调整奖励函数,以确保对整个团队的负面影响。实验结果显示,该攻击方法成功率高达91.6%,而干净性能方差率仅为3.7%。