Dec, 2017

多智能体深度强化学习中主从架构的再认识

TL;DR本研究详细探讨了多智能体领域中基于深度强化学习的主从架构,并结合分散和集中两个视角,提出了具有复合动作表达,可学习通信和独立推理三大关键因素的网络设计方案,在合成环境和 StarCraft 微观管理任务中稳定优于最新竞争方法。