May, 2023

可适应辅助多智能体对抗生成的通信抗干扰多智能体学习

TL;DR本文提出了一种适应性的多智能体辅助对抗生成方法(Multi-Agent Auxiliary Adversaries Generation for robust Communication,MA3C)以提高多智能体强化学习中通信策略的鲁棒性,其中引入了一种新型的信息攻击方法,并采用进化学习的赋权攻击器种群生成策略,同时训练发出消息的系统和攻击器以提高其适应能力。实验证明,该方法提高了多样性和鲁棒性。