MMFeb, 2019

限带宽下的多智能体通信学习 —— 基于互联网数据包路由的应用

TL;DR本研究提出了一种门控机制来自适应地剪枝无用消息,使得在多智能体通信时,性能得到显著提升,同时在真实世界中的数据包路由任务和四个基准测试任务中,比现有的基于深度强化学习和基于规则的方法都表现良好。