上下文离群值解释

Nov, 2017

Contextual Outlier Interpretation

Ninghao Liu, Donghwa Shin, Xia Hu

TL;DR本文提出了一种名为COIN的解释方法，可以从异常得分、有助于异常性的属性和周边情境描述三个方面解释现有检测异常值的异常性，并对各种类型数据集进行了实验，展示了COIN框架相对于现有解释方法的灵活性和有效性。

Abstract

outlier detection plays an essential role in many data-driven applications to identify isolated instances that are different from the majority. While many statistical learning and data mining techniques have been

发现论文，激发创造

异常检测的序列集成学习：偏差-方差视角

本文介绍了一种新的集成异常检测方法CARE，该方法采用顺序集成方法在每个迭代中对中间结果进行二阶段聚合，从而提高了多维点数据异常检测的准确性。该方法结合了并行和顺序模块来降低偏差和方差。实验表明，CARE 相比于基线模型和其他异常检测集成模型表现更好。

Sep, 2016

REMIX: 交互式异常值检测的自动化探索

REMIX是第一个解决交互式环境下异常检测问题的系统，它使用新颖的混合整数规划(MIP)公式，在规定时间内自动选择和执行多样化的异常检测器，包括数据处理算法和特征选择，为分析人员提供两种不同的结果消费方式，即透视图和集成异常检测器。

May, 2017

使用分类数据集评估图级异常检测: 独特的观察和新的见解

研究从图分类数据集为图级异常检测（GLOD）重新配置数据集对于模型性能的影响，发现根据哪个类别被下采样，模型的ROC-AUC性能会显著改变，探究了基于传播的模型所产生的图嵌入空间以及在类别之间的重叠度问题。

Dec, 2020

Rare Yet Popular: 基于标记数据集的网络异常检测证据和影响

本文针对网络环境下的异常检测问题，通过系统分析已有的公共和私有基准数据，探索了其时态性、多变量性和空间属性特征，并提出了基于聚类的简化标注方法，实验结果为2-10倍。

Nov, 2022

可解释的异常值汇总

本文提出了一种名为STAIR的算法，其为大规模、高维数据集中的异常检测结果学习了一组人类可理解的规则，使得机器可以自动从异常数据中提取出可操作的见解。STAIR算法不同于传统的决策树算法，其以最小化复杂度的优化目标，通过递归式划分现有规则来产生简洁、易于理解的规则集。此外，我们还提出了一种名为L-STAIR的本地化STAIR算法，以同时处理高维、高复杂度的数据集。实验结果表明，STAIR算法相对于决策树方法，能够显著减少用于总结异常检测结果的规则复杂度，从而更适合人工评估。

Mar, 2023

基于概率距离的离群点检测

研究提出了一种将基于距离的异常点检测得分转化为可解释的概率估计的方法，其利用数据点之间的距离概率分布将距离得分转换为异常点概率，实验结果显示这种概率转换不影响检测性能，但可产生具有增强对比度的可解释的异常点分数。

May, 2023

监督异常传递学习中的严格率

稀缺的异常数据是学习准确的异常检测决策规则的一个关键障碍。虽然迁移学习方法在异常检测中取得了最近的经验成功，但关于从源异常检测任务向目标任务中传递知识的条件和方式的基本理解仍不清楚。本研究采用Neyman-Pearson分类的传统框架，假设可以访问一些相关的但不完美的异常数据，并给出了关于该问题的信息理论限制，在这些限制下，我们验证了自适应程序在原则上可以实现，即无需关于源和目标异常分布差异的先验信息。

Oct, 2023

异常和异常值检测的元调查

对异常值和离群值对模型估计和数据处理的影响进行了全面的调查，包括对异常检测领域的综述和研究方法进行了研究，揭示了相关主题和方法的发展以及学者在这一领域的写作实践。

Dec, 2023

鲁棒统计规模化异常值评分：提高异常值概率的质量（扩展版）

本研究解决了现有异常值检测算法在异常值得分比较和解释方面的不足，提出鲁棒统计规模化方法，以提高异常值的概率质量。通过实证评估，结果显示该方法能显著改善不同算法生成的异常值概率，特别是在医疗、金融和工程等领域具有重要意义和潜在影响。

Aug, 2024

稳健的异常分数统计缩放：提升异常值概率的质量（扩展版）

本研究解决了异常值检测算法中异常分数可比性不足的问题，提出了一种稳健统计缩放方法，以提高对异常值的概率估计。该方法利用稳健估计量改善了对异常值的概率，特别适用于医疗、金融和工程等重要领域，以防止错过关键异常值。通过对比其他异常分数转换方法，我们的方法在多种真实数据集上表现出色。

Aug, 2024