Feb, 2022

竞争性强化学习中的后门检测与缓解

TL;DR该论文提出了一种名为PolicyCleanse的方法来检测强化学习中的后门攻击,并设计了一种基于机器学习的方法来缓解检测出的后门攻击,实验证明该方法在各种类型的环境和智能体中优于现有后门缓解基线方法至少3%的胜率。