May, 2023

基于深度强化学习的多智能体通信与协作决策研究

TL;DR本篇论文基于 CTDE 框架,研究基于 MAPPO 算法的多智能体合作决策,并引入了基于权重调度和注意力机制的多智能体通信机制以缓解多智能体环境中的非稳定性。提出了 MCGOPPO 算法,并在 SMAC 和 MPE 上进行了实验,结果表明此算法可以改善多智能体环境中的非稳定性,提高多智能体间的协同决策能力。