Oct, 2017

利用视觉先见力检测神经网络策略的对抗攻击

TL;DR本文提出了一种使用基于行为条件帧预测模块的防御机制,以防止深层强化学习代理遭受到对抗攻击,该方法可以检测到对抗性示例的存在,并允许代理在受到攻击时继续执行任务,在Atari 2600游戏中实验结果表明,该方法能够有效检测对抗性示例并在受攻击时获得较高的奖励。