本文研究了如何在线处理恶意样本将其归类到现有的恶意软件代码家族中,或通过聚类将其归入新的恶意软件代码家族中,并根据分类的得分确定分类新样本和聚类剩余数据。实验表明我们的方法有潜力将零日恶意软件分类和聚类到恶意软件家族中。
May, 2023
使用通话图聚类技术进行恶意软件分析,可过滤掉某些程序特征的差异,从而检测到程序间的结构相似性,并结合聚类算法识别出恶意家族,实现恶意程序检测。
Aug, 2010
利用机器学习对恶意软件进行分类和识别的方法可以确切地辨认新型恶意软件家族,并将分类和家族识别能力统一到一个框架中。
Sep, 2023
针对恶意软件行为聚类算法的恶意注入攻击问题,实验证明开源工具 Malheur 容易受到攻击,提出了可能的对策,需要更安全的聚类算法。
Nov, 2018
本文提出一种通过构建 opcode 图和利用聚类算法检测及分析家族病毒的方法,并通过实验验证了其有效性。
Nov, 2022
调查了影响基于机器学习的恶意软件检测和分类的关键因素,并发现静态特征优于动态特征,并且结合二者只能稍微改善静态特征的性能。不同包装方式与分类准确性之间没有关联,而在动态提取特征中缺少行为极大地惩罚了它们的性能。较大数量的待分类家族使分类变得更困难,而每个家族的样本数越多,准确性越高。最后,发现在每个家族的样本均匀分布的情况下训练的模型对未见数据更好地推广。
Jul, 2023
提出了一种计算理论和半监督聚类算法,将聚类定义为根据所选的聚类原则和度量方法获得数据分组,使每个组不包含异常值,所有其他示例被认为是边缘点,孤立的异常值、异常簇或未知簇。
Jun, 2023
该论文综述了在 Windows 环境下应用机器学习技术进行恶意软件分析的方法,并介绍了涉及的因素,包括目标、特征和算法。此外,文中还探讨了相关的数据集、问题和挑战以及未来研究方向,如恶意软件分析经济学。
Oct, 2017
网络安全已成为数字时代的一个重要问题,恶意软件分析作为网络犯罪的一项重要组成部分,而为了解决这个挑战,开发了一个名为 “混淆恶意软件数据集” 的新数据集,其中使用了模仿恶意软件创建者的策略的混淆技术,通过应用不同的传统机器学习算法并进行对比,结果表明 XGBoost 算法的性能优于其他算法,达到了 82% 的准确率、88% 的精确率、80% 的召回率和 83% 的 F1-Score。
通过分析现有的聚类算法,我们在五个不同的维度上对主要算法进行分类,以帮助研究人员从不同的角度理解聚类算法,并帮助他们找到适用于解决特定任务的算法。我们还讨论了聚类算法的当前趋势和未来的潜在方向,以及该领域的挑战和未解决的问题。
Jan, 2024