May, 2024

SleeperNets: 强化学习代理的通用背门毒化攻击

TL;DR该研究探讨了反馈学习中的背门污染攻击,发现前期工作无法横跨领域和 Markov 决策过程进行泛化,所以提出了一种新的攻击框架并开发了 SleeperNets,以提高攻击成功率,并同时保持良性回报。