ICLRMay, 2024

从图模型视角学习多智能体通信

TL;DR通过引入 CommFormer,将多个智能 Agent 之间的通讯架构视为可学习的图形,采用连续松弛和关注机制的方式,在协作任务上优化通讯图并通过梯度下降同时完善架构参数,证实了模型在不同合作场景下,无论 Agent 数量的变化,都能协调更好且更复杂的策略。