针对强化学习网络攻击代理的多智能体网络战模拟器

Apr, 2023

针对强化学习网络攻击代理的多智能体网络战模拟器

A Multiagent CyberBattleSim for RL Cyber Operation Agents

PDF

Thomas Kunz, Christian Fisher, James La Novara-Gsell, Christopher Nguyen, Li Li

TL;DR本文介绍了一个名为 CyberBattleSim 的 RL 训练环境，其支持红方攻击者的训练，并引入了蓝方防御者的训练。实验表明，与红方攻击者同时训练的蓝方防御者能够更好地应对复杂的攻击手段。

Abstract

hardening cyber physical assets is both crucial and labor-intensive. Recently, machine learning (ML) in general and →

hardening cyber physical assets machine learning reinforcement learning training environment

发现论文，激发创造

用多智 - Agent 强化学习从零开始学习网络防御策略

深度学习技术的最新进展为自主网络防御的设计提供了新的可能性，智能代理团队在计算机网络防御角色中可能揭示了保护网络和运动资产的有希望的途径，该研究对比了基于价值的独立学习和集中训练去中心化执行的合作多代理强化学习方法，表明这两种方法都优于简单的多代理启发式防御者，这项工作展示了合作多代理强化学习在学习有效的网络防御策略对抗不同威胁方面的能力。

Aug, 2023

使用基于图的网络攻击模拟训练自动化防御策略

实现并评估了一种基于强化学习的自动化网络防御代理程序，该代理以安全警报作为输入并使用强化学习学习执行预定义的防御措施的策略，使用攻击图模拟网络攻击的环境中，被攻击者执行保护任务。该方法通过使用不同大小的攻击图、攻击者攻击策略和不同的检测系统噪声来进行评估。实验表明，通过强化学习训练的防御代理程序的性能优于使用启发式策略的代理程序，并能够概括不同的攻击者策略。

Apr, 2023

为自主网络代理开发网络 AI 健身房

本文旨在通过应用增强学习和深度增强学习（RL/DRL）来使网络网络运营（CyOps）中的自主智能体成为可能，并且通过提出的一个名为 Cyber Gym for Intelligent Learning（CyGIL）的统一训练环境，尤其是最近发展出的一种在仿真环境下训练智能体的解决方案，该方案旨在在实际网络环境中实现从仿真到现实的自主智能体应用。

Apr, 2023

自主网络代理的统一仿真训练环境

本文介绍了一种自动创建高保真度仿真器的系统，并将其与代理训练流程相结合以进一步减少所需的代理训练时间，其通过连续学习提供一个统一的 CyOp 训练环境，实验结果表明 CyGIL 训练性能良好。

Apr, 2023

战争游戏中智能代理的规模化

未来与先进技术竞争对手保持竞争力需要加快我们在战争推演中人工智能（AI）的研发。更重要的是，利用机器学习进行智能战斗行为开发将成为未来实现超人类表现的关键，提高未来战争决策的质量和加速速度。尽管深度强化学习（RL）在智能代理行为开发方面仍然显示出有希望的结果，但在战斗模拟中通常遇到的长远、复杂任务中尚未达到或超过人类水平。充分利用 RL 的成功潜力和分层强化学习（HRL）的最新成功，我们的研究正在探索和扩展 HRL 的使用，以创建能在这些庞大而复杂的模拟环境中有效执行的智能代理。我们的最终目标是开发出一个能够具有超人类表现的代理，然后作为军事规划者和决策者的人工智能顾问。本文介绍了我们正在进行的方法以及我们的五个研究领域中的前三个，旨在管理迅速增长的计算，这些计算迄今为止限制了 AI 在战斗模拟中的使用: （1）为作战单位开发 HRL 训练框架和代理架构；（2）开发代理决策的多模型框架；（3）开发维度不变的状态空间观察抽象化以管理计算的指数增长；（4）开发内在奖励引擎以实现长期规划；（5）将该框架实施到更高保真度的战斗模拟中。

Feb, 2024

如何根据需要自行决策：利用强化学习代理辅助培养 LLM 在网络安全游戏中成为专家

本研究介绍了 SecurityBot，一种由事先训练好的 RL 智能引导的 LLM 智能体，用于支持网络安全操作，在提供行为准则的基础上使用协作机制和动态建议，实现了与 LLM 或 RL 单独相比显著的性能提升。

Mar, 2024

应对动态对抗性不确定性的网络系统防御中的深度强化学习

本文根据系统状态不确定性和攻防动态的特征，提出了一个数据驱动的 DRL 框架，学习上下文感知的防御措施，以动态适应不断变化的对抗行为，同时最大程度减少对网络系统运营的影响，在多阶段攻击和系统不确定性下，DRL 算法在积极的网络防御中具有很好的效果。

Feb, 2023

通过动作空间对抗训练强化学习智能体的鲁棒性提升

研究了机器学习在具备恶意状态 / 执行机构攻击下的表现，介绍了深度强化学习在决策和控制任务中存在漏洞的问题，提出了通过对抗训练来提高深度强化学习代理的抗干扰性以实现系统的稳定性和鲁棒性。

Jul, 2020

运用强化学习进行高级勒索软件攻击模拟的红队技术

该研究使用增强学习方法来模拟勒索软件攻击，通过训练模型来快速学习有效的攻击策略，揭示网络弱点并开发更强大的防御措施。

Jun, 2024

多智能体强化学习在海上操作技术网络安全中的应用

该论文展示了自主网络防御在工业控制系统中的潜力，并提供了一个基线环境，进一步探索多智能体强化学习在此问题领域的应用。

Jan, 2024