Dec, 2023

基于回声状态网络的多智体强化学习及其在行人动态中的应用

TL;DR近年来,研究了使用多智能体强化学习(MARL)进行行人模拟。该研究考虑了在一个网格世界环境中的道路,并使用回声状态网络和最小二乘策略迭代方法将行人实现为 MARL 智能体。在这个环境下,探究了这些智能体通过避开其他智能体学会向前移动的能力。具体来说,研究了两种类型的任务:在狭窄的直行路线和宽阔的绕行路线之间进行选择,以及走廊中的双向行人流动。模拟结果表明,当智能体的密度不是很高时,学习是成功的。