May, 2023

实际数据上的无监督异常检测算法:我们需要多少个?

TL;DR本研究在 52 个实际多元表格数据集上评估 32 种无监督异常检测算法,在收集的数据集中,K-thNN 算法在大多数情况下表现最佳,也确定了两个清晰的簇,一个有 “局部” 数据集,另一个有 “全局” 数据集,考虑到算法的计算复杂性,这三种算法足以找到代表性的多元数据集中的异常。