Oct, 2020

具有时间消息控制的简洁强健多智体通信

TL;DR本文介绍了一种简单且有效的方法,即‘时间消息控制’(TMC),用于在多智能体强化学习中实现简明而稳健的通信。实验表明,TMC可以在不影响准确性的情况下显著减少智能体间的通信开销,并且在易丢失网络环境中表现出比现有方法更好的鲁棒性。