Apr, 2018

EMBER: 用于训练静态 PE 恶意软件机器学习模型的公开数据集

TL;DREMBER 数据集为反恶意 Windows 便携式可执行文件静态检测训练机器学习模型提供标记的基准数据集,包括从 110 万个二进制文件中提取的特征:900K 个训练样本(300K 个恶意样本,300K 个良性样本,300K 个未标记样本)和 200K 个测试样本(100K 个恶意样本,100K 个良性样本),并提供相关的数据处理代码和基线模型 MalConv 性能比较结果。