基于活动学习的孤立森林 (ALIF):增强决策支持系统中的异常检测
通过自适应主动学习采样策略,利用数据先验分布和模型不确定性,我们的方法在检测异常时的主动学习中胜过现有方法,并在三个高度不平衡的 UCI 基准数据集和一个真实世界的已编辑电子邮件数据集上取得了好的结果。
Jul, 2023
该论文提出了一种基于注意力机制综合孤立森林的入侵检测系统,该系统在 NSL-KDD 和 KDDCUP'99 数据集上的平均检测 F1-Score 为 0.93,执行时间降低了 91.78%。结果证明了该方法在 DDoS 防御上的低复杂度和低计算需求。
Apr, 2022
本文介绍了 EIF +,即 Enhanced Isolation Forest 的改进版本,用于增强概括能力;同时,提出了 ExIFFI,一种为 Extended Isolation Forest 添加解释性特征的新方法,即特征排名;实验结果表明 ExIFFI 在异常检测方面具有解释性,并作为无监督环境下的有效特征选择技术。
Oct, 2023
本文提出了高效而省时的方法,在隔离森林的全局和局部层面上定义特征重要性得分,并定义了一种在无监督异常检测中执行特征选择的过程。在多个合成和实际数据集上评估了性能,并与现有技术进行比较。
Jul, 2020
本研究旨在将广泛应用于有限维数据的孤立森林(Isolation Forest)方法扩展到函数数据,以便更准确地检测出复杂基础设施的异常情况,并提出了基于 IF 算法的函数统计深度方法和多元函数扩展。
Apr, 2019
本研究旨在回答孤立森林隔离效率的理论最优分支因子,并通过偏差减少实现更好的偏差 - 方差权衡,提出一种 OptIForest 算法,结合基于聚类的哈希学习,以实现更好的隔离效果、更高效且更具鲁棒性。在一系列基准数据集上的实验表明,该方法普遍优于深度学习等现有方法。
Jun, 2023
介绍一种名为 Extended Isolation Forest(EIF)的算法,用于解决 Isolation Forest 算法在给定数据点上分配异常得分的问题,主要采用两种不同的方法来改善问题,通过分别对多个数据集进行分析,证明了算法的鲁棒性显著提高,但在计算时间方面没有明显差异。
Nov, 2018
本文提出了在异常检测应用中使用可配置的主动学习算法来优化检测过程,通过采用集成学习模型、使用紧凑描述、改进实例的多样性、正确检测数据漂移,实现了降低假正例率且不损失检测率的目的。
Sep, 2018
本文介绍了一种基于主动学习框架(ALF)的网络流量分类方法,它提供了准备好的软件组件,用于部署主动学习循环和自动维护数据集和机器学习模型的实例。该方法可应用于高速网络(100Gb/s),支持不同的注释、评估和数据集优化策略的研究实验。
Oct, 2022