Oct, 2020

D3C: 多智能体学习中降低混沌代价

TL;DRD3C 算法通过引入 Price of anarchy 的不可微上界,使得每个多智能体可以调整其激励机制,从而提高系统的效率。