Dec, 2019

BADGER: 通过多智能体通信学习(学习算法)

TL;DR本研究提出了一种基于新颖的内存多智能体元学习架构和学习过程的方法,使得通过学习算法来进行通信,可以学习共享的通信策略,从而在单个代理中的同质专家的相互作用中出现行为、适应性和适应性学习。由于所有专家在代理内共享单一策略,以及 'Badger' 的内在可模块化性,所提出的架构应该允许超越现有方法所见的一般化水平。