Aug, 2021

均场多智体强化学习:一种分散网络方法

TL;DR提出了基于LTDE-Neural-AC和演员-评论家方法的多智能体强化学习算法,应用于自驾车、拼车、数据和交通路由模型的图网络,其解决了分散式多智能体强化学习网络结构的问题,并具有收敛保证的优势。