AAAIOct, 2020

未知环境映射的异构多智能体强化学习

TL;DR本文提出了一种基于 actor-critic 算法的多智能体学习方法,可以让一组异构代理学习无人机覆盖未知环境的分散控制策略,此方法可被应用于国家安全和紧急响应组织中以提高在危险区域中的情境感知能力。