May, 2023

针对对手感知的去中心化网络多智能体强化学习算法

TL;DR研究了去中心化的多智能体强化学习算法,引入了对抗性智能体对共识更新的漏洞,并提出了一种算法,使得非对抗性智能体在受限制的情况下达成共识。