Jan, 2024

使用强化学习发现指挥与控制渠道

TL;DR通过采用基于强化学习的方法,模拟了一个三阶段的命令与控制流程,并建立了一个马尔可夫决策过程来最大化数据窃取的有价值主机数量,同时考虑到负载和防御机制,该方法在网络安全领域具有高效性且成果良好。