运用强化学习进行高级勒索软件攻击模拟的红队技术

Jun, 2024

运用强化学习进行高级勒索软件攻击模拟的红队技术

Leveraging Reinforcement Learning in Red Teaming for Advanced Ransomware Attack Simulations

Cheng Wang, Christopher Redino, Ryan Clark, Abdul Rahman, Sal Aguinaga...

TL;DR该研究使用增强学习方法来模拟勒索软件攻击，通过训练模型来快速学习有效的攻击策略，揭示网络弱点并开发更强大的防御措施。

Abstract

ransomware presents a significant and increasing threat to individuals and organizations by encrypting their systems and not releasing them until a large fee has been extracted. To bolster preparedness against potential attacks, organizations commonly conduct →

ransomware red teaming exercises reinforcement learning attack strategies defensive measures

发现论文，激发创造

针对强化学习网络攻击代理的多智能体网络战模拟器

本文介绍了一个名为 CyberBattleSim 的 RL 训练环境，其支持红方攻击者的训练，并引入了蓝方防御者的训练。实验表明，与红方攻击者同时训练的蓝方防御者能够更好地应对复杂的攻击手段。

Apr, 2023

强韧性对抗性强化学习

提出了一种稳健性的敌对训练 (robust adversarial reinforcement learning, RARL) 方法，该方法将敌对训练与零和极小优化相结合，通过训练一个智能体，使其能够在真实系统上的杂乱因素和不确定性下操作，并在多种环境中进行了验证。

Mar, 2017

MERLIN -- 基于强化学习的恶意软件逃避技术

本文研究了利用增强学习挑战现有的基于机器学习的恶意代码检测引擎，提出了一种修改 PE 文件的策略并且使用 REINFORCE 算法达到很好的逃避效果。

Mar, 2022

Raijū: 强化学习引导的后渗透自动化安全评估网络系统

我们提出了 Raiju 框架，这是一个基于强化学习的自动化方法，可帮助渗透测试人员快速完成网络系统的后渗透安全评估过程。通过使用两种强化学习算法（A2C 和 PPO）训练智能代理，我们实现了自动选择和执行行动以利用目标系统中的漏洞，从而自动化渗透测试工作流程的某些方面，增强其对新出现的威胁和漏洞的响应能力。

Sep, 2023

RansomAI: 基于人工智能的勒索软件，用于隐蔽性加密

提出了一种基于强化学习的框架 RansomAI，旨在通过学习最佳加密算法、速率和持续时间，使勒索软件可以自适应地调整其加密行为，并保持隐身，使其不易被检测到。实验结果表明，该框架可以在少数几分钟内达到超过 90％的准确率，成功逃避了 Crowdsensor 上运行的 Ransomware-PoC 的检测。

Jun, 2023

通过强化学习学习如何逃避静态 PE 机器学习恶意软件模型

该研究提出了一种基于强化学习的通用框架，用于攻击静态的可移植执行文件软件应用防病毒引擎，具有黑盒特性，通过与防病毒引擎进行若干次博弈，学习哪些操作序列可能会导致任何给定的恶意软件样本逃避检测。作者的方法可以攻击梯度提升机器学习模型，并导致可逃避检测的功能有害软件样本的生成，但在对抗训练中存在过拟合的危险。

Jan, 2018

用多智 - Agent 强化学习从零开始学习网络防御策略

深度学习技术的最新进展为自主网络防御的设计提供了新的可能性，智能代理团队在计算机网络防御角色中可能揭示了保护网络和运动资产的有希望的途径，该研究对比了基于价值的独立学习和集中训练去中心化执行的合作多代理强化学习方法，表明这两种方法都优于简单的多代理启发式防御者，这项工作展示了合作多代理强化学习在学习有效的网络防御策略对抗不同威胁方面的能力。

Aug, 2023

深度强化学习在网络安全中的应用

本文综述了应用深度强化学习方法来解决网络安全领域中的复杂、动态和高维防御问题的 DRL 方法，并强调了 DRL 在网络物理系统，自主入侵检测和通过游戏模拟来应对网络攻击的策略防御方面的价值，同时也提出了对未来 DRL 网络安全研究发展的建议。

Jun, 2019

通过网络流量分析和机器学习技术来缓解勒索软件威胁

这篇论文集中讨论了一种在计算机网络中识别和检测勒索软件的方法，该方法基于机器学习算法和对网络流量模式的分析，显示机器学习算法可以通过网络流量准确识别和检测勒索软件。

Jan, 2024

应对动态对抗性不确定性的网络系统防御中的深度强化学习

本文根据系统状态不确定性和攻防动态的特征，提出了一个数据驱动的 DRL 框架，学习上下文感知的防御措施，以动态适应不断变化的对抗行为，同时最大程度减少对网络系统运营的影响，在多阶段攻击和系统不确定性下，DRL 算法在积极的网络防御中具有很好的效果。

Feb, 2023