Feb, 2023

在对抗多智体系统中学习合作行为

TL;DR本文介绍了一个基于虚拟多智能体平台的扩展,称为TripleSumo,用于研究连续动作空间中多智能体的合作行为,在对抗性环境中进行物理接触。我们对两个代理Bug和Ant与Spider进行合作的情景进行了研究,并首次提出加入Bug的强化学习算法DDPG,通过混合奖励结构定量评估了合作行为。