对异常值和离群值对模型估计和数据处理的影响进行了全面的调查,包括对异常检测领域的综述和研究方法进行了研究,揭示了相关主题和方法的发展以及学者在这一领域的写作实践。
Dec, 2023
本文综合研究了 12 个最流行的无监督异常检测方法,发现它们被评估时使用了不一致的协议,因此定义了一致的评估协议并用于比较它们在五个广泛使用的表格式数据集上的性能。尽管评估不能确定一种方法在所有数据集上优于其他方法,但它识别出那些突出表现的方法并修正了关于它们相对性能的错误认识。
Apr, 2022
本文提供了对不同算法家族的主要在线探测器的质量、综合概述,包括构建、更新和测试探测模型的主要思想,并提供了在线检测算法与离线对应算法的结果定量实验评估的彻底分析,以及对数据集(即元特征)的各种特征进行统计分析。
Sep, 2022
在本研究中,我们通过可视证据和统计分析剖析了像素级异常检测中存在的正常样本和异常样本严重不平衡的复杂挑战,并深入探讨了需要考虑不平衡的评估指标的需求。通过对 21 个异常检测问题上使用 11 种领先的现代异常检测方法进行广泛实验评估,我们可以得出结论,基于 Precision-Recall 的指标可以更好地捕捉方法性能的相对关系,使其更适用于这一任务。
Oct, 2023
本文针对深度学习异常检测问题进行了系统综述,将研究方法划分为不同的类别并探讨其在应用领域的适用性和效果,同时讨论了现有研究的局限性和未来研究的方向。
Jan, 2019
本篇论文介绍了针对时间序列数据异常检测的分类方法,并对传统和深度学习技术进行了评估和比较,为选择最适合特定应用设置的方法提供了指导,并提出了研究方向。
本文针对网络环境下的异常检测问题,通过系统分析已有的公共和私有基准数据,探索了其时态性、多变量性和空间属性特征,并提出了基于聚类的简化标注方法,实验结果为 2-10 倍。
Nov, 2022
本文通过对 30 种算法在 57 个数据集上进行广泛实验,从不同角度回答了关于异常检测算法与监督程度、异常类型、噪声数据表现的问题。在对 ADBench 数据集进行全面介绍的同时,文章提出了未来算法选择和设计方向,并且为作者贡献的数据集提供了公正的比较基线算法。文中开源了 ADBench 数据集及相应结果,具有较高的可访问性和可复现性。
Jun, 2022
本文在分析基准数据集时发现部分数据困扰检测算法流程,进而提出了 UCR Time Series Anomaly Archive 资源库,以期为学术界提供合适的评测标准并提升异常数据检测的研究进展。
Sep, 2020
这篇系统综述主要研究与连接和自动驾驶车辆相关的异常检测。研究发现,神经网络(如 LSTM,CNN 和自编码器)以及单类支持向量机是最常用的人工智能算法。大多数异常检测模型使用真实世界的车辆数据进行训练,但常常人为地向数据集中注入攻击和故障等异常情况。这些模型主要通过召回率、准确率、精确率、F1 分数和误报率等五个主要评估指标进行评估。此外,文章提出了几项建议,包括综合使用多个评估指标、公开分享模型以促进研究社区的合作和验证,并需要建立具有预定义异常或网络攻击的基准数据集来测试和改进提出的基于异常的检测模型的有效性。此外,对使用不同于 CAN 协议(如以太网和 FlexRay)的入侵检测系统的研究还缺乏。
May, 2024