Sep, 2024

应用行为掩蔽和课程学习技术提高操作技术网络安全中的数据效率和整体性能的强化学习研究

TL;DR本研究旨在解决操作技术网络安全防御强化学习代理训练中的数据效率问题。通过引入课程学习和行为掩蔽技术,本文在最困难的测试环境中实现了显著性能提升,表明这些方法可以有效应对复杂的网络安全威胁,并在较少的时间步长内达到更高的回报水平。