Feb, 2024

通过在线学习和自适应猜想实现自动安全响应

TL;DR我们研究了一个 IT 基础设施的自动化安全响应,并将攻击者和防御者之间的交互形式化为一种部分观察到的非稳定游戏。我们通过估计模型的概率性猜想来捕捉基础设施和玩家意图的不确定性,利用贝叶斯学习和回滚的方法在线学习有效的游戏策略,并证明了推测收敛于最佳拟合,并提供了基于推测模型的性能改进的界限。我们提出了 Berk-Nash 均衡的一种变体来刻画游戏的稳态。通过一个高级持续威胁的使用案例来展示我们的方法。基于测试平台的模拟研究表明,我们的方法能够产生适应不断变化的环境的有效安全策略,并且我们还发现相比当前的强化学习技术,我们的方法能够实现更快的收敛。