IJCAIMar, 2017

深度强化学习智能体的对抗攻击策略

TL;DR研究了使用对抗性样本攻击深度强化学习算法的两种策略,即战略定时攻击和诱人攻击,并在 DQN 和 A3C 等深度强化学习算法上应用这两种策略,结果显示,战略定时攻击只攻击少量时间步骤时,能够显著减少代理的奖励,而诱人攻击成功地将代理引向指定的目标状态。