使用近似时间信息对强化学习智能体进行黑盒攻击

Sep, 2019

使用近似时间信息对强化学习智能体进行黑盒攻击

Blackbox Attacks on Reinforcement Learning Agents Using Approximated Temporal Information

Yiren Zhao, Ilia Shumailov, Han Cui, Xitong Gao, Robert Mullins...

TL;DR通过使用序列到序列（sequence-to-sequence）模型和时序信息，本研究在黑盒攻击下预测和触发强化学习（reinforcement learning）代理的行为，并提出对先前论文中的缺陷进行了新的评估基准。

Abstract

Recent research on reinforcement learning (RL) has suggested that trained agents are vulnerable to maliciously crafted adversarial samples. In this work, we show how such samples can be generalised from White-box

reinforcement learning adversarial samples black-box attacks sequence-to-sequence models time-series information

发现论文，激发创造

深强化学习交易代理的灰盒对抗攻击

通过在同一股票市场进行交易，该研究展示了利用混合深度神经网络作为策略的对抗智能代理能够对深度强化学习交易代理进行攻击，并且能够显著降低其奖励值，从而大幅减少基线系统、集成方法、以及工业合作伙伴开发的自动交易软件的潜在利润。

Sep, 2023

深度强化学习攻击特征分析

本研究主要研究深度强化学习模型的脆弱性，针对相应的攻击方式进行了探究，并提出了黑盒攻击、在线顺序攻击等攻击方法来应对其高计算需求，同时探讨了攻击者扰动环境动态的可能性，并通过实验验证了这些攻击方式的有效性。

Jul, 2019

稀疏黑盒视频攻击与强化学习

该研究提出了一种基于强化学习 (RL) 框架的黑盒视频攻击方法，通过调整关键帧的选择策略，使反对抗扰动逐渐变小，实验证明该方法可以有效降低反对抗扰动。

Jan, 2020

针对受攻击方策略访问有限的强化学习的行为目标攻击

研究考虑攻击强化学习代理，其中对手通过对受害者的状态观察添加敌对修改来控制受害者的行为，提出了一种在黑盒和无盒设置中操纵受害者代理的新方法，无需特定环境启发式，并通过分布匹配问题解决现有的模仿学习算法，实证评估表明该方法攻击性能优于基准方法。

Jun, 2024

在线深度强化学习黑盒目标化奖励中毒攻击

本文提出了一种针对在线深度增强学习的黑盒定向攻击方法，通过在训练时进行奖励污染，攻击突破了未知环境和未知算法的限制，并且攻击成本较低。作者通过实验验证，在不同的环境和学习器中，攻击可以高效地导致学习代理到达各种目标策略。

May, 2023

深度强化学习的白盒对抗策略

本文研究白盒子对抗策略的效果，发现黑盒子对抗相对于对抗策略而言效果较差，训练白盒子对抗可以提高单 agent 环境的鲁棒性。

Sep, 2022

灰盒对抗训练

本文介绍了对抗性训练及其在构建鲁棒模型方面的应用，提出了新型白盒和黑盒攻击，即灰盒对抗攻击，提出了一种新颖的模型鲁棒性评估方法，并提出了一种新型的对抗性训练：灰盒对抗训练，其使用模型的中间版本来引导敌手生成更加有效的对抗样本，实验证明此方面的成果优于传统方法。

Aug, 2018

使用强化学习的通用分布式基于决策的黑盒对抗攻击

研究在决策类攻击领域提出了像素级决策驱动的黑盒攻击算法，该算法使用增强学习算法找到对抗性扰动分布，经实验证明，与现有技术相比更具攻击成功率和可转移性。

Nov, 2022

一种面向深度强化学习的时序模式后门攻击

本文提出了一种基于时间模式的背门攻击方法，通过一系列的时间限制来控制背门行为的发动和持续时间，实现在云计算中调度任务过程中的达成攻击目的和保持攻击效果和隐秘性，实验结果表明，该背门攻击方法可以达到很高的攻击成功率和干扰效果。

May, 2022

强化学习中的奖励污染：对未知环境中的未知学习者的攻击

研究黑盒奖励污染攻击，设计了一种名为 U2 的新型黑盒攻击来操纵奖励以误导不知道先前知识的 RL 代理，进而学习一种恶意策略，可在最具挑战性的黑盒设置中实现接近最先进白盒攻击的性能。

Feb, 2021