MMFeb, 2019
限带宽下的多智能体通信学习 —— 基于互联网数据包路由的应用
Learning Multi-agent Communication under Limited-bandwidth Restriction for Internet Packet Routing
Hangyu Mao, Zhibo Gong, Zhengchao Zhang, Zhen Xiao, Yan Ni
TL;DR本研究提出了一种门控机制来自适应地剪枝无用消息,使得在多智能体通信时,性能得到显著提升,同时在真实世界中的数据包路由任务和四个基准测试任务中,比现有的基于深度强化学习和基于规则的方法都表现良好。