May, 2022

通过智能通信渠道协调多个代理商之间的政策

TL;DR本文提出了一种新的多智能体强化学习通信方式,通过智能协调员筛选和解释所有代理提供的信号来提高个体的集体表现,该架构优于现有基线方法在多个合作环境中的表现。