本文介绍了 EIF +,即 Enhanced Isolation Forest 的改进版本,用于增强概括能力;同时,提出了 ExIFFI,一种为 Extended Isolation Forest 添加解释性特征的新方法,即特征排名;实验结果表明 ExIFFI 在异常检测方面具有解释性,并作为无监督环境下的有效特征选择技术。
Oct, 2023
我们对孤立森林方法进行了两项改进,第一项改进是信息论动机的评分函数推广,允许考虑整个分布而不仅仅是树的平均值;第二项改进是替换孤立森林中基于深度的评分方法,采用基于孤立树叶节点相关的超体积的评分方法,并在生成数据和 34 个 “ADBench” 基准数据集上进行了评估,发现在一些数据集上这两种变体都有显著的改进,并且对于这两种变体中的一种,平均来说在所有数据集上都有改进。我们提供了用于重现实验结果的代码。
Sep, 2023
本研究旨在将广泛应用于有限维数据的孤立森林(Isolation Forest)方法扩展到函数数据,以便更准确地检测出复杂基础设施的异常情况,并提出了基于 IF 算法的函数统计深度方法和多元函数扩展。
Apr, 2019
本文讨论了隔离森林 (iForest) 算法的改进,即通过非一致随机选择变量和 / 或阈值的方式,优于原算法在某些离群点类别的识别方面,并对比测试不同的分割指导标准。
Oct, 2021
本研究旨在回答孤立森林隔离效率的理论最优分支因子,并通过偏差减少实现更好的偏差 - 方差权衡,提出一种 OptIForest 算法,结合基于聚类的哈希学习,以实现更好的隔离效果、更高效且更具鲁棒性。在一系列基准数据集上的实验表明,该方法普遍优于深度学习等现有方法。
Jun, 2023
本文提出了高效而省时的方法,在隔离森林的全局和局部层面上定义特征重要性得分,并定义了一种在无监督异常检测中执行特征选择的过程。在多个合成和实际数据集上评估了性能,并与现有技术进行比较。
Jul, 2020
提出两种新的 AD 算法,以解决 Functional Isolation Forest (FIF) 在线性内积和词典选择方面的限制,结果通过多个数值实验得到验证。
Mar, 2024
本文提出了一种基于主动学习的方法(ALIF),用于检测具有领域特定异常定义的不寻常行为,并且性能优于其他最先进的算法。该方法特别适用于集成有异常检测功能的决策支持系统(DSS)。
Jul, 2022
本文提出了一种新的方法,利用二进制反馈来改进基于树的异常检测算法(Isolation Forest Algorithm)的性能,从而减少高排名误报的数量,使得人工分析者可以更容易地发现感兴趣的异常点,特别适用于大数据集的交互式异常发现。
Aug, 2017
这篇论文介绍了一种针对决策树模型的 OutOf-Distribution(OOD)泛化的新颖有效解决方案,名为不变决策树(IDT)。IDT 通过在树的生长过程中对于不同环境下分割的不稳定 / 变化行为施加惩罚项来实现 OOD 泛化。通过理论结果和合成以及真实数据集的数值测试,证实了所提出的方法的优越性能,表明决策树模型的 OOD 泛化是绝对必要且应该更加关注。
Dec, 2023