Feb, 2023

两个智能体强化学习中的隐式毒化攻击:对训练时间攻击的敌对策略

TL;DR在两个代理环境中,研究了攻击者通过修改同伴的策略来隐性毒化其中一个代理器的有效环境的针对性中毒攻击,并提出了一个优化框架,用于设计最优攻击。通过实验展示了算法的有效性。