ICMLSep, 2023

层次化多智能体强化学习在空战机动中的应用

TL;DR应用人工智能模拟空战场景吸引了越来越多的关注,本文提出了一种用于多个异构代理的空中对空战斗的层次化多代理强化学习框架,其中命令决策过程划分为两个抽象阶段,低级政策控制个体单位的行动,高级指挥官政策根据总体任务目标下达宏观指令,并通过针对预先训练的低级政策对任务目标进行训练,实验证明了我们设计的优点。