基于活动学习的孤立森林 (ALIF)：增强决策支持系统中的异常检测

Jul, 2022

基于活动学习的孤立森林 (ALIF)：增强决策支持系统中的异常检测

Active Learning-based Isolation Forest (ALIF): Enhancing Anomaly Detection in Decision Support Systems

Elisa Marcelli, Tommaso Barbariol, Gian Antonio Susto

TL;DR本文提出了一种基于主动学习的方法（ALIF），用于检测具有领域特定异常定义的不寻常行为，并且性能优于其他最先进的算法。该方法特别适用于集成有异常检测功能的决策支持系统（DSS）。

Abstract

The detection of anomalous behaviours is an emerging need in many applications, particularly in contexts where security and reliability are critical aspects. While the definition of anomaly strictly depends on the domain framework, it is often impractical or too time consuming to obtain a fully labelled dataset. The use of →

anomalous behaviour unsupervised models active learning decision support system isolation forest

发现论文，激发创造

无监督学习分布属性可辅助人工标记并提高异常检测中的主动学习效率

通过自适应主动学习采样策略，利用数据先验分布和模型不确定性，我们的方法在检测异常时的主动学习中胜过现有方法，并在三个高度不平衡的 UCI 基准数据集和一个真实世界的已编辑电子邮件数据集上取得了好的结果。

Jul, 2023

ARLIF-IDS -- 基于注意力机制的实时孤立森林入侵检测系统

该论文提出了一种基于注意力机制综合孤立森林的入侵检测系统，该系统在 NSL-KDD 和 KDDCUP'99 数据集上的平均检测 F1-Score 为 0.93，执行时间降低了 91.78％。结果证明了该方法在 DDoS 防御上的低复杂度和低计算需求。

Apr, 2022

ExIFFI 和 EIF+：解释性和增强泛化能力，扩展扩展隔离森林

本文介绍了 EIF +，即 Enhanced Isolation Forest 的改进版本，用于增强概括能力；同时，提出了 ExIFFI，一种为 Extended Isolation Forest 添加解释性特征的新方法，即特征排名；实验结果表明 ExIFFI 在异常检测方面具有解释性，并作为无监督环境下的有效特征选择技术。

Oct, 2023

基于深度孤立森林特征重要性的可解释异常检测

本文提出了高效而省时的方法，在隔离森林的全局和局部层面上定义特征重要性得分，并定义了一种在无监督异常检测中执行特征选择的过程。在多个合成和实际数据集上评估了性能，并与现有技术进行比较。

Jul, 2020

功能孤立森林

本研究旨在将广泛应用于有限维数据的孤立森林（Isolation Forest）方法扩展到函数数据，以便更准确地检测出复杂基础设施的异常情况，并提出了基于 IF 算法的函数统计深度方法和多元函数扩展。

Apr, 2019

OptIForest: 异常检测的最优独立森林

本研究旨在回答孤立森林隔离效率的理论最优分支因子，并通过偏差减少实现更好的偏差 - 方差权衡，提出一种 OptIForest 算法，结合基于聚类的哈希学习，以实现更好的隔离效果、更高效且更具鲁棒性。在一系列基准数据集上的实验表明，该方法普遍优于深度学习等现有方法。

Jun, 2023

扩展隔离森林

介绍一种名为 Extended Isolation Forest（EIF）的算法，用于解决 Isolation Forest 算法在给定数据点上分配异常得分的问题，主要采用两种不同的方法来改善问题，通过分别对多个数据集进行分析，证明了算法的鲁棒性显著提高，但在计算时间方面没有明显差异。

Nov, 2018

签名隔离森林

提出两种新的 AD 算法，以解决 Functional Isolation Forest (FIF) 在线性内积和词典选择方面的限制，结果通过多个数值实验得到验证。

Mar, 2024

基于集成的主动异常检测

本文提出了在异常检测应用中使用可配置的主动学习算法来优化检测过程，通过采用集成学习模型、使用紧凑描述、改进实例的多样性、正确检测数据漂移，实现了降低假正例率且不损失检测率的目的。

Sep, 2018

自动化网络流量分类的主动学习框架

本文介绍了一种基于主动学习框架（ALF）的网络流量分类方法，它提供了准备好的软件组件，用于部署主动学习循环和自动维护数据集和机器学习模型的实例。该方法可应用于高速网络（100Gb/s），支持不同的注释、评估和数据集优化策略的研究实验。

Oct, 2022