IJCAIAug, 2022

理解情节强化学习中中毒攻击的限制

TL;DR本研究考察了有关毒化攻击的 Reinforcement Learning 算法(强化学习算法)的安全威胁,发现了在有界奖励和无界奖励环境下,通过奖励毒化和行为毒化的组合可以实现对任何目标策略的操作,而在无界奖励环境下则只需要进行奖励毒化攻击就足以将任何高阶最优学习算法转化为任何目标策略,而不需要知道 MDP 的潜在特性,这些研究结果为设计强健性 RL 算法提供了有用的启示。