Feb, 2021

强化学习中防御奖励中毒攻击

TL;DR本文提出了防御策略,针对强化学习中的奖励污染攻击,并使用优化框架和性能保证来设计对抗策略。