恶意软件数据依赖图特征的 kNN 分类

Jun, 2024

恶意软件数据依赖图特征的 kNN 分类

kNN Classification of Malware Data Dependency Graph Features

John Musgrave, Anca Ralescu

TL;DR基于数据依赖图构造的特征表示进行分类，提高了分类准确度和可解释性，同时证明数据依赖图能够准确捕捉语义和结构信息。

Abstract

feature resolution impacts the ability of classifiers to make explainable inferences when applied to malware classification. We explore cl

feature resolution classifiers explainable inferences data dependency graphs malware classification

发现论文，激发创造

深度 k 近邻：朝着自信、可解释和鲁棒的深度学习发展

本研究针对深度学习在对抗性环境下的鲁棒性和预测不可解释性等问题，通过将 k-NN 算法与深度学习结合，提出了一种名为 DkNN 的混合分类器，它可以为输入数据提供信心估计和人类可解释的预测解释。实验证明，DkNN 算法可以准确识别模型外部的输入，同时提供直观和有用的模型失败解释。

Mar, 2018

一种基于图的性能分析新型表示学习技术

将表格形式的性能数据转换为图形，利用图神经网络方法捕捉特征和样本之间复杂的关系，以提高回归任务的性能分析领域中的预测模型的性能。

Jan, 2024

基于调用图聚类的恶意软件分类

使用通话图聚类技术进行恶意软件分析，可过滤掉某些程序特征的差异，从而检测到程序间的结构相似性，并结合聚类算法识别出恶意家族，实现恶意程序检测。

Aug, 2010

使用来源图结构特征解释基于 GNN 的 IDS 检测

PROVEXPLAINER 提出了一种通过将 GNN 决策边界投影到可解释的特征空间来提高 GNN 安全模型透明度和可解释性的框架，使用决策树等可解释性模型复制 GNN 安全模型的决策过程，提高辅助模型的准确性和可信度，实验结果表明，该模型在程序分类任务中达到了 95% 离线度并在特定任务的恶意软件检测任务中达到了 99% 的准确率。

Jun, 2023

基于图像的恶意软件分类的迁移学习

本文研究利用图像分析进行恶意软件检测与分类问题，通过将可执行文件转化为图像并采用基于深度学习模型的图像识别，利用现有大数据集上的预训练深度学习模型进行迁移学习训练。通过与 k - 最邻近算法相比较，实验表明深度学习模型具有更好的泛化性能。

Jan, 2019

利用 k 近邻表示解释和改善模型行为

使用 kNN 表示法来解释 NLP 模型的预测结果，发现其除了具有解释性外，还能揭示学习到的虚假关联，发现存在错误标记的例子，并提高模型的性能和抵御对抗攻击的能力。

Oct, 2020

恶意软件分类中机器学习的解密：数据集、特征提取和模型性能的深入探究

调查了影响基于机器学习的恶意软件检测和分类的关键因素，并发现静态特征优于动态特征，并且结合二者只能稍微改善静态特征的性能。不同包装方式与分类准确性之间没有关联，而在动态提取特征中缺少行为极大地惩罚了它们的性能。较大数量的待分类家族使分类变得更困难，而每个家族的样本数越多，准确性越高。最后，发现在每个家族的样本均匀分布的情况下训练的模型对未见数据更好地推广。

Jul, 2023

本地可解释的机器学习和人工智能：初步结果和未来方向

该论文介绍了如何结合 k 最近邻算法与信息论来解决机器学习模型复杂度与可解释性之间的矛盾，以实现全面审计的机器学习和人工智能技术

Jan, 2019

基于字节的深度神经网络用于恶意软件分类的激活分析

使用深度学习模型从二进制数据中自动学习特征表征，在对恶意软件分类中取得了一定的成果，同时探索了训练数据规模和正则化等因素对分类器性能的影响。

Mar, 2019

恶意软件检测中机器学习对 Mal-API-2019 数据集的综合评估

本研究使用机器学习技术对恶意软件检测进行了全面研究，重点评估了在 Mal-API-2019 数据集上使用各种分类模型的效果，旨在通过更有效地识别和减轻威胁来提升网络安全能力。研究探讨了集成和非集成的机器学习方法，例如随机森林、XGBoost、K 最近邻（KNN）和神经网络。特别强调了数据预处理技术的重要性，尤其是 TF-IDF 表示和主成分分析，在提高模型性能方面起到了积极作用。结果表明，集成方法，特别是随机森林和 XGBoost，相比其他方法表现出更高的准确性、精确度和召回率，凸显了它们在恶意软件检测中的有效性。该论文还讨论了限制和未来的潜在方向，强调了持续适应恶意软件演变性质的需求。这项研究为网络安全领域的持续讨论做出了贡献，并为在数字时代开发更强大的恶意软件检测系统提供了实用洞察。

Mar, 2024