Oct, 2022

一种可扩展的强化学习方法,用于在群体与群体交战问题中进行攻击分配

TL;DR本文提出了一种强化学习 (RL) 框架,用于控制一大规模群体的密度以对抗敌对群体攻击。通过将群体对抗问题建模为马尔科夫决策过程并开发出 RL 算法,可在不了解敌对群体策略 / 动态的情况下计算出对抗策略,模拟结果表明,所开发的框架可以以高效的方式处理各种大规模对抗场景。