Jan, 2019

通过基于记忆的通信提高小规模多智体深度强化学习中的协调

TL;DR本文提出了一个基于深度确定性策略梯度的多智能体训练框架,利用存储设备并发端到端学习明确的通信协议,来提高小规模系统中智能体的协作和性能,同时研究了不同通信模式对性能的影响。