May, 2021

BACKDOORL: 一种针对竞争性强化学习的后门攻击

TL;DR本文探讨了将后门攻击技术应用于多智能体强化学习系统中的可能性,并证明了在两个竞技型强化学习系统中,头部代理可以通过其自身动作触发受害代理的后门,并且当后门被激活时,受害者的获胜率下降了 17% 至 37%。