May, 2022

基于奖励随机化强化学习的多域网络攻防游戏

TL;DR本文提出一种基于强化学习的多领域网络攻防博弈模型,通过奖励随机化强化学习以及建立攻击方和防守方两个代理人的方式,提高防守者的防御能力,实现多领域网络攻防状态的模拟,相比 DDPG 和 DQN,该方法有较高的防御成功率。