Sep, 2019

使用近似时间信息对强化学习智能体进行黑盒攻击

TL;DR通过使用序列到序列(sequence-to-sequence)模型和时序信息,本研究在黑盒攻击下预测和触发强化学习(reinforcement learning)代理的行为,并提出对先前论文中的缺陷进行了新的评估基准。