May, 2024

分布式强化学习中的合作后门攻击与理论保证

TL;DR该研究论文调查了一种在分散式增强学习场景中的合作后门攻击方法,通过将后门行为分解为多个组件并将其隐藏在恶意代理的策略中,并与良性代理共享策略,成功地向良性代理的增强学习策略中注入了后门攻击。与现有的后门攻击相比,该合作方法更加隐蔽,因为每个攻击者的策略只包含后门攻击的一个组件,难以检测。通过基于Atari环境的广泛模拟实验证明了该方法的效率和隐蔽性。据我们所知,这是首次提出在分散式增强学习中的可证明的合作后门攻击的论文。