Nov, 2018

基于异常的网络入侵检测数据集基准测试:KDD CUP 99替代方案

TL;DR本文研究了机器学习在基于异常的网络入侵检测系统(A-NIDS)中的应用,并发现使用KDD-99数据集进行研究存在偏差。通过比较许多分类模型的性能,以及使用SMOTE过采样技术和随机欠采样技术来创建一个平衡的NSL-KDD数据集,我们证明了数据偏斜会影响分类模型的准确性,从而导致潜在的安全风险。我们探索了一个现代的替代品UNSW-NB15,并发现在二元情况下,使用SMOTE进行训练后的UNSW-NB15数据集可以与NSL-KDD和KDD-99相匹配或超过加权F1分数,因此值得被使用作为现代替代品。