MMSep, 2021

多智能体自然演员 - 评论强化学习算法

TL;DR本研究提出三种完全分散的自然 Actor Critic (MAN)算法,具有全局收敛性和在交通网络中降低平均拥堵率的实际应用。