自动日志解析的工具和基准
本文介绍了一种基于 n-gram 字典的自动日志分析方法 Logram,通过与其他五种最先进的日志解析方法的比较,我们发现 Logram 在解析效率方面表现出色,能够支持在线解析日志,并且不会因为 Spark 节点数增加而减少解析准确度。
Jan, 2020
本文探讨了 ChatGPT 在自动日志解析方面的能力,并针对两个研究问题进行了评估,结果表明 ChatGPT 可以通过适当的提示方法实现良好的日志解析结果,尤其是采用少样本提示时效果最佳,同时提出了 ChatGPT 日志解析面临的挑战和机遇。
Jun, 2023
本研究使用大型语言模型(LLMs)进行日志解析,并提出了基于生成型 LLMs 和小规模微调的 LLMParser 方法。通过对 16 个开源系统进行评估,结果显示 LLMParser 相比现有方法具有显著更高的解析准确率(平均 96% 准确率)。另外,研究还对训练数据规模、模型大小和预训练 LLMs 对解析准确率的影响进行了综合实证分析,并发现较小的 LLMs 可能比更复杂的 LLMs 更有效。此外,对于从其他系统的日志进行预训练的 LLMs,并不总是能够提高解析准确率。总而言之,研究为使用 LLMs 进行日志解析提供了实证证据,并强调了基于 LLMs 的日志解析器的局限性和未来研究方向。
Apr, 2024
在 AI 运维领域中,对于保证信息系统有序和稳定运行,日志分析至关重要。然而,现有大语言模型在日志分析任务中的表现尚未得到充分验证。为此,我们引入了 LogEval,这是一个综合性基准套件,旨在首次评估大语言模型在不同日志分析任务中的能力。这个基准套件包括日志解析、日志异常检测、日志故障诊断和日志摘要等任务。通过对领先的大语言模型进行严格评估,我们展示了不同大语言模型技术对日志分析性能的影响,重点关注自一致性和少样本上下文学习等方面。我们还讨论了与模型量化、中英文问答评估和提示工程相关的发现。这些发现深入了解了大语言模型在多语言环境中的优势和弱点,以及不同提示策略的有效性。通过采用不同任务的各种评估方法,准确衡量了大语言模型在日志分析中的性能,确保了全面的评估。从 LogEval 评估中获得的见解揭示了大语言模型在日志分析任务中的优势和局限性,为研究人员和从业人员提供了宝贵的指导。
Jul, 2024
通过对以往日志分析研究所采用的常见日志表示技术进行研究和比较,本文选择了六种日志表示技术,并结合七种机器学习模型和四个公共日志数据集,在基于日志的异常检测背景下进行评估,同时分析了日志解析过程和不同特征聚合方法的影响,从而为未来研究人员和开发者在设计自动化日志分析工作流程时提供一些启发性指南,以更好地理解不同日志表示技术的特点,并指导选择最合适的技术进行基于机器学习的日志分析工作流程。
Aug, 2023
通过使用信息熵采样和思维链合并的先进方法,Lemur 日志解析框架成功解决了依赖人工规则以及忽略日志信息语义的问题,实现了最先进的性能和出色的效率。
Feb, 2024
ECLIPSE 是增强型跨语言工业日志解析模型,它通过整合两种有效的数据驱动模板匹配算法和 Faiss 索引,结合大型语言模型的语义理解能力准确提取日志关键词的语义并有效减少检索空间,具有卓越性能和处理效率。
May, 2024
该论文通过对 12 个公开事件日志,12 个专有事件日志和 9 个质量指标的评估,对自动化流程发现方法进行了系统的回顾和比较评估,突出了该领域存在的差距和未被探索的权衡,其中包括某些方法缺乏可扩展性以及它们在所使用的不同质量度量方面性能强烈分歧。
May, 2017
LogPrompt 是一种新颖的零 - shot 且可解释的日志分析方法,使用大型语言模型进行任务,并利用先进的提示策略提高性能,相对于现有的基于已训练数据的方法,LogPrompt 在使用零训练数据的情况下能够在各项评估任务中表现出色。
Aug, 2023
日志分析和监控是软件维护和缺陷识别的重要方面。本文提出了一种基于语义的在线聚类方法,动态更新日志聚类以实现对代码错误生命周期的监控,并引入了一种新的度量指标来评估时间日志聚类的性能。通过在工业数据集上进行实验,发现我们的解决方案优于类似系统,希望本研究能在缺陷数据集的时间性探索方面鼓励更多研究。
Mar, 2024