May, 2021

均场博弈集群!以强化学习为方式

TL;DR我们提出了一种方法,使大量智能体学习群集行为,我们将问题视为均值场博弈,并结合深度强化学习和标准化流的算法找到纳什均衡来适应所在群体的平均速度,我们将其应用于多组或高维群集,并在学习过程中增加了障碍。