基于日志的深度学习异常检测：我们走得有多远？

Feb, 2022

基于日志的深度学习异常检测：我们走得有多远？

Log-based Anomaly Detection with Deep Learning: How Far Are We?

Van-Hoang Le, Hongyu Zhang

TL;DR本文旨在对当前流行的五种基于深度学习模型的系统异常检测方法进行全面评估。通过对四个公共 log 数据集进行实验，我们发现训练数据选择、数据分组、类别分布、数据噪声和早期检测能力等因素都对模型评估产生了重要影响，并指出当前没有解决日志异常检测的问题。

Abstract

software-intensive systems produce logs for troubleshooting purposes. Recently, many deep learning models have been proposed to automatically detect system anomalies based on →

software-intensive systems deep learning models anomaly detection log data model evaluation

发现论文，激发创造

企业软件的基于日志的异常检测：一个实证研究

对比多个先进的异常检测模型在工业数据集上的表现，结果显示某些模型更适用于结构较松散的数据集，并且研究人员通过定性研究分析了这些模型在识别不同类型的异常时的优势和局限性，最后对训练集大小进行逐渐增加并评估模型的有效性。

Oct, 2023

基于机器学习的基于日志的异常检测的实证研究

对传统机器学习和深度学习技术在日志分析和异常检测中的评估进行了全面的实证研究，结果表明传统机器学习技术和深度学习技术在检测准确性和预测时间方面非常接近，而传统机器学习技术对超参数调整的敏感性较深度学习技术要低。此外，半监督技术的检测准确性明显较监督技术差。

Jul, 2023

评估基于序列的异常检测技术常用日志数据集的关键回顾

本篇研究分析了六个公开可用的日志数据集，关注异常的表现形式和简单的检测技术，结果显示大多数异常与顺序表现无直接联系，不需要先进的检测技术即可实现对这些数据集的高检测率。

Sep, 2023

利用大数据和深度学习优化异常检测以减少误报

本研究提出应用深度模型代替传统模型以减少误报率并通过使用大数据和深度模型获得更少的错误报告。在 NSL-KDD 基准测试上进行了实验，并与传统学习中最常用的分类器之一进行了比较，结果表明使用深度学习相对于传统学习具有较低的虚警率 10％。

Sep, 2022

基于树的方法在异常检测中能超越深度学习吗？一项基准研究

该论文通过综合基准研究评估了多种基于机器学习的异常检测算法，并发现树型算法在许多情境下表现优于深度学习。

Feb, 2024

MLAD: 多系统日志异常检测的统一模型

提出了一种新的异常检测模型 MLAD，该模型通过语义关系推理跨越多个系统。实验证明了 MLAD 的优越性。

Jan, 2024

基于日志的可伸缩和自适应异常检测，专家在环节中

提出了一种基于 Trie 数据结构和机器学习的日志异常检测框架 SeaLog，实验结果表明 SeaLog 相比基线方法实现更高的准确性和效率，并且可以借助 ChatGPT 等大型语言模型进行异常日志数据的快速反馈和验证。

Jun, 2023

大规模异常检测：深度分布式时间序列模型的应用

论文介绍了一种新的检测时间序列数据异常值的方法，主要应用于监测微服务和云资源健康。该方法的主要创新点是将时间序列的建模对象从实数值或实数向量扩展到了实数值（或向量）上的概率分布。

Jul, 2020

基于日志表示的异常检测的有效性研究

通过对以往日志分析研究所采用的常见日志表示技术进行研究和比较，本文选择了六种日志表示技术，并结合七种机器学习模型和四个公共日志数据集，在基于日志的异常检测背景下进行评估，同时分析了日志解析过程和不同特征聚合方法的影响，从而为未来研究人员和开发者在设计自动化日志分析工作流程时提供一些启发性指南，以更好地理解不同日志表示技术的特点，并指导选择最合适的技术进行基于机器学习的日志分析工作流程。

Aug, 2023

基于事件日志分析的故障检测与预测特征选取

该研究提出了一种基于日志的异常检测和预测的特征选择方法，以提高对复杂系统下子系统级别上的异常检测效率和准确性。

Aug, 2022