May, 2022

针对网络入侵检测数据集特征调整的集成分类器设计

TL;DR本文针对 UNSW-NB15 数据集的类不平衡和特征空间中的类重叠问题,提出了一种机器学习分类器的数据驱动设计和性能评估方法,其中使用 Balanced Bagging、eXtreme Gradient Boosting、Hellinger Distance Decision Tree 等集成方法来解决不平衡数据问题,提出了两种新的算法来解决类重叠问题,并提高了测试数据的分类性能。实验证明,相比已有技术,该方法在二元和多种情况下均有显著优势。