May, 2023

进化生成辅助对抗攻击者实现鲁棒的多智能体协调

TL;DR该研究提出了一种名为ROMANCE的方法,通过演化生成辅助对抗攻击者,使训练的策略在训练期间遭遇多样性和强大的辅助对抗攻击,从而实现对策略扰动的高鲁棒性。该方法在多种场景中表现出与其他基准方法相当甚至更好的鲁棒性和泛化能力。