Sep, 2023

基于分布和容量的孤立森林评分

TL;DR我们对孤立森林方法进行了两项改进,第一项改进是信息论动机的评分函数推广,允许考虑整个分布而不仅仅是树的平均值;第二项改进是替换孤立森林中基于深度的评分方法,采用基于孤立树叶节点相关的超体积的评分方法,并在生成数据和 34 个 “ADBench” 基准数据集上进行了评估,发现在一些数据集上这两种变体都有显著的改进,并且对于这两种变体中的一种,平均来说在所有数据集上都有改进。我们提供了用于重现实验结果的代码。