Nov, 2022

多机器人社交感知协作规划在行人环境中的多智能体强化学习

TL;DR本文提出了一种基于离线多智能体强化学习(MARL)的多机器人社交感知和高效协同规划方法,使用时间 - 空间图(TSG)进行社交编码,引入 K 步先见奖励设置,并改进了传统的集中式批判者网络,从而在多群组实验中验证了该方法的有效性。