对抗策略：攻击深度强化学习

May, 2019

Adversarial Policies: Attacking Deep Reinforcement Learning

Adam Gleave, Michael Dennis, Neel Kant, Cody Wild, Sergey Levine...

TL;DR在零和游戏的模拟人形机器人中，使用拥有不良意图的对手智能体可以生成表面上看似随机无序的行为，以攻击通过自我对弈训练而具有抵抗敌方攻击鲁棒性的最新受害者，尤其在高维度环境中更加有效，且可以诱导受害策略网络的不同反应。

Abstract

deep reinforcement learning (RL) policies are known to be vulnerable to adversarial perturbations to their observations, similar to adversarial examples for classifiers. However, an attacker is not usually able to directly modify another agent's observations. This might lead one to won

发现论文，激发创造

深度强化学习智能体的对抗攻击策略

研究了使用对抗性样本攻击深度强化学习算法的两种策略，即战略定时攻击和诱人攻击，并在DQN和A3C等深度强化学习算法上应用这两种策略，结果显示，战略定时攻击只攻击少量时间步骤时，能够显著减少代理的奖励，而诱人攻击成功地将代理引向指定的目标状态。

Mar, 2017

利用视觉先见力检测神经网络策略的对抗攻击

本文提出了一种使用基于行为条件帧预测模块的防御机制，以防止深层强化学习代理遭受到对抗攻击，该方法可以检测到对抗性示例的存在，并允许代理在受到攻击时继续执行任务，在Atari 2600游戏中实验结果表明，该方法能够有效检测对抗性示例并在受攻击时获得较高的奖励。

Oct, 2017

深度强化学习攻击特征分析

本研究主要研究深度强化学习模型的脆弱性，针对相应的攻击方式进行了探究，并提出了黑盒攻击、在线顺序攻击等攻击方法来应对其高计算需求，同时探讨了攻击者扰动环境动态的可能性，并通过实验验证了这些攻击方式的有效性。

Jul, 2019

针对深度强化学习的隐蔽高效敌对攻击

探索针对深度强化学习的对抗攻击，并提出两种攻击技术:关键点攻击和拮抗攻击，以提高鲁棒性，实验结果显示这两种技术比现有方法更具优势。

May, 2020

基于学习得到的优化对手的状态观测下鲁棒强化学习

研究了强化学习在面对敌对攻击(即使状态的扰动)时的鲁棒性，并提出了一种基于ATLA框架的方法来增强Agent的鲁棒性，通过训练online的对抗学习可以达到最优敌对攻击框架与提前学习历史数据等手段，从而提高强化学习在实验中的表现。

Jan, 2021

深度强化学习的白盒对抗策略

本文研究白盒子对抗策略的效果，发现黑盒子对抗相对于对抗策略而言效果较差，训练白盒子对抗可以提高单 agent 环境的鲁棒性。

Sep, 2022

重新思考敌对政策：多智能体RL中的广义攻击公式与可证明防御

本文研究在强化学习的多智能体环境中，攻击者通过对受害者智能体进行对抗性的过程来实施攻击，并提出了一种更一般化的攻击模型，通过攻击预算来实现对智能体的控制，可产生能够利用受害者智能体的隐蔽性对抗策略，同时提供了首个提供收敛证明的保护方案，以对抗最强的对抗性训练。

May, 2023

SUB-PLAY: 针对部分观测多智能体强化学习系统的对抗性策略

多智能体强化学习中的安全威胁及对策的研究，包括针对对手生成敌对策略时的部分可观测性限制的黑盒攻击方法以及针对这些策略的潜在防御方式的评估和建议。

Feb, 2024

通过对抗攻击和训练的强大深度强化学习：一项综述

深度强化学习可以通过对抗训练提高其鲁棒性和可靠性，本研究对当代对抗性攻击方法进行了深入分析和分类，以提高深度强化学习代理的鲁棒性。

Mar, 2024

走向强壮的策略：通过对抗攻击和防守增强离线强化学习

该研究提出了一个框架，通过利用先进的对抗攻击和防御来提高离线强化学习模型的稳健性，并以D4RL基准进行了评估，结果显示了演员和评论家对攻击的脆弱性以及防御策略在提高策略稳健性方面的有效性，为提高实际场景中离线强化学习模型的可靠性提供了希望。

May, 2024