基于高分辨率图像的恶意软件分类使用多实例学习

Nov, 2023

基于高分辨率图像的恶意软件分类使用多实例学习

High-resolution Image-based Malware Classification using Multiple Instance Learning

Tim Peters, Hikmat Farhat

TL;DR本文提出了一种利用高分辨率灰度图像和多实例学习将恶意软件分类为家族的新方法，以克服敌对二进制扩大。通过经验分析和实验表明，现有的基于可视化的恶意软件分类方法往往依赖于输入的有损转换，如调整大小来处理大型、大小可变的图像，而这些方法会导致关键信息的丢失，被利用。提出的解决方案将图像划分为补丁，并使用嵌入式多实例学习、卷积神经网络和注意力聚合函数进行分类。该实现在 Microsoft 恶意软件分类数据集上进行评估，并在与基线 22.8% 相比，对敌对扩大样本的准确率达到 96.6%。Python 代码可在此 https URL 上在线获取。

Abstract

This paper proposes a novel method of classifying malware into families using high-resolution greyscale images and multiple instance learning to overcome adversarial binary enlargement. Current methods of visuali

malware classification greyscale images multiple instance learning embedding-based convolutional neural network

发现论文，激发创造

深度多任务学习用于恶意软件图像分类

一种新的多任务学习框架用于恶意软件图像分类，以实现准确快速的恶意软件检测，并通过与其他激活函数的实验结果表明，其在各个任务上的准确度高于 99.87％，能够有效检测隐藏技术并在准确性方面达到最新方法的水平。

May, 2024

基于频域图像可视化和深度学习的恶意软件检测

该研究提出了一种基于图像分类的新方法来检测和可视化恶意软件，其使用 N-gram (DCT) 离散余弦变换和神经网络对可执行二进制文件进行表征和分类，利用自动生成的图像转换为视觉数据集用于训练和测试，最终获得了 96% 的分类精度。

Jan, 2021

恶意软件检测中的对抗样本探索

研究卷积神经网络在恶意软件检测中的应用，探索对抗样本在该领域中的影响，发现之前的攻击不如之前报告的那么有效，同时还存在架构上的弱点，容易遭受新的攻击策略，继而探讨了攻击策略的可变性、提高攻击有效性的权衡以及单步攻击的可转移性。

Oct, 2018

基于解释的 DNNs 恶意软件检测漏洞分析框架

本文提出了一种基于实例攻击的算法，通过数据增强和分析恶意代码的数据组成部分，实现了在黑盒环境下欺骗深度神经网络的目的，从而提高了针对恶意代码的检测系统的鲁棒性。

Sep, 2022

基于迁移学习的不平衡恶意软件字节图像分类的比较分析

通过比较六个多类分类模型在三个数据集上的性能，观察了类别不平衡对模型性能和收敛的影响，发现类别不平衡越严重，收敛所需的时期越少，而不同模型的性能也存在较大差异。此外，研究还发现 ResNet50、EfficientNetB0 和 DenseNet169 可以很好地处理不平衡和平衡的数据，其中不平衡数据集的最高精度达到了 97%，中等不平衡数据集的最高精度达到了 95%，完全平衡的数据集的最高精度也达到了 95%。

Oct, 2023

基于分布式 QCNN 的深度恶意软件检测

通过使用灰度处理方法与由五个分布式量子卷积网络和评分函数组成的模型相结合，我们实现了对数据集的新预处理，以提高基于图像的恶意软件检测的性能，而不增加量子位所需的资源，结果表明测试的准确率和 F1 评分分别提高了约 20%。

Dec, 2023

基于深度神经网络的二维二进制程序特征恶意软件检测

本文介绍了一种基于深度神经网络的恶意软件分类器，可以在商品硬件上处理实际金融企业数据达到 95% 的检测率和 0.1% 的误报率。

Aug, 2015

多尺度注意力多实例学习用于多千兆像素组织学图像分类

本文提出了一个深度学习管道，以多个实例学习和注意力机制对组织检查图像进行分类，并成功实现了对鼻咽癌的 LMP1 状态预测。通过可视化注意力分数，该方法还允许对模型的解释性进行检查。

Sep, 2022

基于图像的恶意软件分类的迁移学习

本文研究利用图像分析进行恶意软件检测与分类问题，通过将可执行文件转化为图像并采用基于深度学习模型的图像识别，利用现有大数据集上的预训练深度学习模型进行迁移学习训练。通过与 k - 最邻近算法相比较，实验表明深度学习模型具有更好的泛化性能。

Jan, 2019

关于持续学习在恶意软件分类中的局限性

该研究探讨了 11 种连续学习技术在恶意软件分类任务中的应用，包括任务、类别和域的增量学习，在两个现实的、大规模的恶意软件数据集上进行测试，结果表明，大部分连续学习方法在性能上都不如简单的关联式回放方法。

Aug, 2022