在 Azure 核心工作负载洞察中的高显著性故障检测
研究开发了两种新的统计技术,用于自动检测云基础架构数据中的异常,采用季节性分解和鲁棒统计度量,有效实现在季节性高峰存在的情况下的异常检测。从容量规划,用户行为和监督学习三个方面证明了所提出技术的有效性。
Apr, 2017
本文介绍了微软公司开发的时间序列异常检测服务的流程和算法,并且首次尝试将 Spectral Residual 模型与卷积神经网络相结合,用于时间序列异常检测,经过实验验证,在公共数据集和微软生产数据中的表现都优于现有成果。
Jun, 2019
本文在分析基准数据集时发现部分数据困扰检测算法流程,进而提出了 UCR Time Series Anomaly Archive 资源库,以期为学术界提供合适的评测标准并提升异常数据检测的研究进展。
Sep, 2020
该研究论文提出了一种关联时间异常检测模型(RTAnomaly),该模型结合了指标的关联和时间信息,通过图注意力层学习指标之间的依赖关系,并利用正无标签学习来解决训练数据中潜在异常的问题。实验证明,RTAnomaly 在公共数据集和两个工业数据集上表现优于基准模型,平均 F1 得分为 0.929,Hit@3 为 0.920。
Jul, 2023
快速有效的基于序列模式相似性的异常检测和警报过滤方法在大规模现实世界工业系统中被应用,通过与现有基准方法进行对比,验证了其普适性和稳健性。
May, 2024
该研究论文提出了一个自动化机器学习框架,旨在帮助水文学家检测美国东北部关键区域研究流域传感器生成的时间序列数据中的异常。该框架着重于识别峰值模式异常,该类异常可能来自传感器故障或自然现象。为了应对这些挑战,该框架利用合成生成的时间序列数据注入合成峰值模式,生成带有标签的数据集,并结合自动化超参数优化机制选择最合适的深度学习模型。该框架使用时间序列生成对抗网络 (TimeGAN) 作为合成数据集生成器,并通过准确性和计算成本等指标对产生的模型实例进行评估。通过应用于流域数据集的性能评估,该框架始终选择满足用户偏好的最佳模型实例。
Sep, 2023
该研究论文提出了一个全面的自动参数优化框架,用于时间序列异常检测模型,通过预测分数、形状分数和灵敏度分数三个优化目标,可以适应不同的模型,简化用户的操作,并取得了良好的检测结果。
Jul, 2023
论文介绍了一种新的检测时间序列数据异常值的方法,主要应用于监测微服务和云资源健康。该方法的主要创新点是将时间序列的建模对象从实数值或实数向量扩展到了实数值(或向量)上的概率分布。
Jul, 2020
现代软件系统在复杂性和数量方面不断增长,对多变量监测指标进行异常检测变得越来越关键和具有挑战性。本文提出了一种基于协作机制的多变量监测指标上的异常检测框架 CMAnomaly,该框架能捕捉到不同指标之间以及它们的历史模式之间的依赖关系,通过代价有效的模型实现了准确的异常检测。通过实验结果表明,CMAnomaly 相对于现有基准模型在 F1 得分和运行速度上取得了显著的改进。此外,我们还分享了在华为云中部署 CMAnomaly 的经验。
Aug, 2023