已知和新兴恶意软件家族的在线聚类

May, 2024

已知和新兴恶意软件家族的在线聚类

Online Clustering of Known and Emerging Malware Families

Olha Jurečková, Martin Jureček, Mark Stamp

TL;DR通过使用基于机器学习的在线聚类模型，该研究论文介绍了一种将恶意软件样本在线聚类为恶意软件家族的方法，提高了恶意软件检测和分类的效率。

Abstract

Malware attacks have become significantly more frequent and sophisticated in recent years. Therefore, malware detection and classification are critical components of information security. Due to the large amount

malware detection classification clustering algorithms machine learning online clustering

发现论文，激发创造

零日恶意软件的分类和在线聚类

本文研究了如何在线处理恶意样本将其归类到现有的恶意软件代码家族中，或通过聚类将其归入新的恶意软件代码家族中，并根据分类的得分确定分类新样本和聚类剩余数据。实验表明我们的方法有潜力将零日恶意软件分类和聚类到恶意软件家族中。

May, 2023

基于调用图聚类的恶意软件分类

使用通话图聚类技术进行恶意软件分析，可过滤掉某些程序特征的差异，从而检测到程序间的结构相似性，并结合聚类算法识别出恶意家族，实现恶意程序检测。

Aug, 2010

MalwareDNA: 恶意软件、恶意软件家族和新型恶意软件的同时分类

利用机器学习对恶意软件进行分类和识别的方法可以确切地辨认新型恶意软件家族，并将分类和家族识别能力统一到一个框架中。

Sep, 2023

恶意行为软件聚类中毒攻击

针对恶意软件行为聚类算法的恶意注入攻击问题，实验证明开源工具 Malheur 容易受到攻击，提出了可能的对策，需要更安全的聚类算法。

Nov, 2018

基于聚类的 Opcode 图生成用于恶意软件变种检测

本文提出一种通过构建 opcode 图和利用聚类算法检测及分析家族病毒的方法，并通过实验验证了其有效性。

Nov, 2022

恶意软件分类中机器学习的解密：数据集、特征提取和模型性能的深入探究

调查了影响基于机器学习的恶意软件检测和分类的关键因素，并发现静态特征优于动态特征，并且结合二者只能稍微改善静态特征的性能。不同包装方式与分类准确性之间没有关联，而在动态提取特征中缺少行为极大地惩罚了它们的性能。较大数量的待分类家族使分类变得更困难，而每个家族的样本数越多，准确性越高。最后，发现在每个家族的样本均匀分布的情况下训练的模型对未见数据更好地推广。

Jul, 2023

聚类的计算理论与半监督算法

提出了一种计算理论和半监督聚类算法，将聚类定义为根据所选的聚类原则和度量方法获得数据分组，使每个组不包含异常值，所有其他示例被认为是边缘点，孤立的异常值、异常簇或未知簇。

Jun, 2023

恶意软件分析的机器学习技术调查

该论文综述了在 Windows 环境下应用机器学习技术进行恶意软件分析的方法，并介绍了涉及的因素，包括目标、特征和算法。此外，文中还探讨了相关的数据集、问题和挑战以及未来研究方向，如恶意软件分析经济学。

Oct, 2017

智能 OMVI：使用新的数据集识别混淆恶意软件变种

网络安全已成为数字时代的一个重要问题，恶意软件分析作为网络犯罪的一项重要组成部分，而为了解决这个挑战，开发了一个名为 “混淆恶意软件数据集” 的新数据集，其中使用了模仿恶意软件创建者的策略的混淆技术，通过应用不同的传统机器学习算法并进行对比，结果表明 XGBoost 算法的性能优于其他算法，达到了 82% 的准确率、88% 的精确率、80% 的召回率和 83% 的 F1-Score。

Sep, 2023

聚类算法快速综述

通过分析现有的聚类算法，我们在五个不同的维度上对主要算法进行分类，以帮助研究人员从不同的角度理解聚类算法，并帮助他们找到适用于解决特定任务的算法。我们还讨论了聚类算法的当前趋势和未来的潜在方向，以及该领域的挑战和未解决的问题。

Jan, 2024