Mar, 2023

可解释的异常值汇总

TL;DR本文提出了一种名为 STAIR 的算法,其为大规模、高维数据集中的异常检测结果学习了一组人类可理解的规则,使得机器可以自动从异常数据中提取出可操作的见解。STAIR 算法不同于传统的决策树算法,其以最小化复杂度的优化目标,通过递归式划分现有规则来产生简洁、易于理解的规则集。此外,我们还提出了一种名为 L-STAIR 的本地化 STAIR 算法,以同时处理高维、高复杂度的数据集。实验结果表明,STAIR 算法相对于决策树方法,能够显著减少用于总结异常检测结果的规则复杂度,从而更适合人工评估。