Jul, 2020

PhishZip:一种基于压缩的检测网络钓鱼网站的新算法

TL;DR本文提出PhishZip,一种新的钓鱼检测方法,使用压缩算法进行网站分类,并演示了使用单词出现似然分析构建压缩模型单词词典的系统方法。使用压缩比作为机器学习特征,PhishZip检测效果优于先前研究中表现最佳的基于HTML的特征,真正阳性率可达80.04%。同时,使用压缩比作为附加特征,真正阳性率显着提高30.3%(从51.47%提高到81.77%) ,准确性提高11.84%(从71.20%提高到83.04%)。