ICLRFeb, 2019

多智能体强化学习中通信调度的学习

TL;DR本研究提出了一种名为 SchedNet 的多智能体强化学习框架,其中智能体能够自主学习如何安排通讯、编码消息以及根据接收到的信息选择动作,并在合作通讯与导航以及捕猎等不同应用场景下展示了比其他机制更显著的表现差距,达到 32% 至 43% 的性能优势。