ICLRApr, 2022

野火管理资源分配的图神经网络通信层协作自适应多智能体强化学习

TL;DR提出一种基于多智能体强化学习和图神经网络通讯层的方法,在火灾管理资源分配中,通过通信环境特征和部分可见火灾,实现协作分配资源,优于贪心启发式基线和单智能体设置,并展示了自动课程和开放性对其泛化能力的改善。