Nov, 2023

基于高分辨率图像的恶意软件分类使用多实例学习

TL;DR本文提出了一种利用高分辨率灰度图像和多实例学习将恶意软件分类为家族的新方法,以克服敌对二进制扩大。通过经验分析和实验表明,现有的基于可视化的恶意软件分类方法往往依赖于输入的有损转换,如调整大小来处理大型、大小可变的图像,而这些方法会导致关键信息的丢失,被利用。提出的解决方案将图像划分为补丁,并使用嵌入式多实例学习、卷积神经网络和注意力聚合函数进行分类。该实现在 Microsoft 恶意软件分类数据集上进行评估,并在与基线 22.8% 相比,对敌对扩大样本的准确率达到 96.6%。Python 代码可在此 https URL 上在线获取。