Jan, 2018

通过强化学习学习如何逃避静态 PE 机器学习恶意软件模型

TL;DR该研究提出了一种基于强化学习的通用框架,用于攻击静态的可移植执行文件软件应用防病毒引擎,具有黑盒特性,通过与防病毒引擎进行若干次博弈,学习哪些操作序列可能会导致任何给定的恶意软件样本逃避检测。作者的方法可以攻击梯度提升机器学习模型,并导致可逃避检测的功能有害软件样本的生成,但在对抗训练中存在过拟合的危险。