NetRCA: 一种有效的网络故障原因定位算法
本文提出一种名为 CORAL 的在线根本原因分析框架,结合多元奇异谱分析和累积和统计学的方法,实现了系统实时状态的自动检测和更新原因分析模型,进而定位根本原因。实验表明,该框架在三个真实世界数据集的案例研究中表现出更高的准确性和优越性。
May, 2023
通过使用半监督学习方法处理稀有和未知错误,并设计了处理噪声数据的方法,我们提出了一种名为 LogRCA 的方法,用于识别以最小集合描述根本原因的日志行,其在大规模生产日志数据集上的评估结果表明,在检测候选根本原因的精确性和召回率方面,LogRCA 始终优于基于深度学习和统计分析的对比方法,并且我们还研究了部署的数据平衡方法的影响,结果显示它显著提高了对稀有故障的性能。
May, 2024
KGroot 使用事件知识和事件之间的关联性,通过整合知识图谱和 GCNs 进行根因推理,以自动识别故障事件和传播路径之间的关系,实现了准确率为 93.5% 的根本原因定位,表现优于工业环境中实时故障诊断和 RCA 的最先进基线。
Feb, 2024
制造电动车过程中的根本原因分析 (RCA) 是识别故障原因的过程。传统上,RCA 是通过依靠过程专家知识进行手动进行的。与此同时,传感器网络在制造过程中收集了大量的数据。使用这些数据进行 RCA 使其更高效。然而,纯数据驱动的方法如因果贝叶斯网络在大规模的实际制造过程中存在问题,因为有大量的潜在因果关系。此外,纯数据驱动的方法有可能遗漏已知的因果关系或学习到虚假的因果关系。本文提出了一种结合电动车制造过程的专家知识和数据驱动机器学习方法的交互智能 RCA 工具。它利用制造过程的大规模知识图谱进行推理,并学习因果贝叶斯网络。此外,交互式用户界面使得过程专家可以通过向知识图谱添加和删除信息来对根本原因图进行反馈。这种交互智能 RCA 工具减少了因果贝叶斯网络的学习时间,同时减少了虚假因果关系的数量。因此,交互智能 RCA 工具在专家和机器学习方法之间建立了一个闭环反馈。
Jan, 2024
5G 技术带来了重大的里程碑发展,允许新的应用,如增强现实和自动驾驶车辆。然而,这些改进带来了管理复杂性的增加和对故障处理的特别关注,因为 5G 旨在支持的应用程序严重依赖于高网络性能和低延迟。因此,自动自愈解决方案已经成为处理这一要求的有效方式,允许基于学习的系统自动检测异常并执行根本原因分析 (RCA)。然而,实施这种智能系统存在固有的挑战。首先,在异常检测和 RCA 方面缺乏合适的数据,因为故障场景的标记数据不常见。其次,当前的智能解决方案针对 LTE 网络定制,没有完全捕捉到数据中存在的时空特征。鉴于此,我们利用一个校准的模拟器 Simu5G,生成开源的正常和故障场景数据。使用该数据,我们提出了 Simba,一个在 5G 无线接入网络 (RANs) 中进行异常检测和根本原因分析的最先进方法。我们利用图神经网络来捕捉空间关系,而 Transformer 模型则用于学习数据的时间依赖性。我们实现了 Simba 的原型并对多个故障进行了评估。将结果与现有解决方案进行比较,验证了 Simba 的优越性。
Jun, 2024
PyRCA 是一款面向人工智能 IT 运维的 Python 机器学习库,提供一个全面的框架来揭示复杂的度量因果关系并自动定位事故的根本原因,包含多种因果发现方法和根本原因评分方法,并提供直观的图形用户界面,方便专业人员易于使用和注入专业知识。
Jun, 2023
本文介绍了 6G 网络的前景和挑战,综述了现有的网络根本原因分析方法,并提出了一种基于人工智能的网络根本原因分析框架,该框架在综合网络数据上的表现优于现有方法。
Dec, 2022
本研究提出了一种统一的多模态因果结构学习方法 Mulna,通过一个定制的语言模型来学习日志表示,将日志序列转化为时间序列数据,并采用基于对比学习的方法提取多模态中不变和特定于模态的表示。此外,引入了一种考虑关键性能指标的注意机制来评估模态可靠性,并共同学习最终的因果图。最后,通过随机游走重启来模拟系统故障传播并识别潜在的根本原因。对三个真实世界数据集的广泛实验证实了我们提出的框架的有效性。
Feb, 2024
通过使用结构因果模型中的因果反事实的定量贡献分析,最近的工作对异常情况的根本原因分析进行了概念化。本文提出了简化、高效的根本原因分析方法,用于识别唯一的根本原因而非定量贡献分析的任务。对于未知因果有向无环图的应用场景,我们将异常得分最高的变量作为根本原因进行启发式验证。
Jun, 2024
本文提出了一种新的因果推理任务 —— 干预识别方法,称作 “因果推理基础的根因分析(CIRCA)”,并在在线服务系统监控数据的背景下构建了因果贝叶斯网络。实验结果表明,相对于其他基线方法,CIRCA 能够提高前 1 推荐的召回率达到 25% 的效果。
Jun, 2022