ICLRApr, 2022
野火管理资源分配的图神经网络通信层协作自适应多智能体强化学习
Collaborative Auto-Curricula Multi-Agent Reinforcement Learning with Graph Neural Network Communication Layer for Open-ended Wildfire-Management Resource Distribution
Philipp Dominic Siedler
TL;DR提出一种基于多智能体强化学习和图神经网络通讯层的方法,在火灾管理资源分配中,通过通信环境特征和部分可见火灾,实现协作分配资源,优于贪心启发式基线和单智能体设置,并展示了自动课程和开放性对其泛化能力的改善。