超越随机输入：一种基于机器学习的硬件模糊测试

Apr, 2024

超越随机输入：一种基于机器学习的硬件模糊测试

Beyond Random Inputs: A Novel ML-Based Hardware Fuzzing

Mohamadreza Rostami, Marco Chilese, Shaza Zeitouni, Rahul Kande, Jeyavijayan Rajendran...

TL;DR现代计算系统在硬件作为信任根基上依赖较重。然而，不断增加的复杂性导致了跨层攻击可以利用的安全关键弱点。我们提出了一种新颖的基于 ML 的硬件模糊测试工具 ChatFuzz，它利用类似 ChatGPT 的 LLMs 来理解处理器语言，并通过代码覆盖度度量指标引导输入生成，以此解决现有工具在实际时间范围内无法全面覆盖复杂硬件设计的问题。在测试中，与最先进的模糊测试工具相比，ChatFuzz 在仅 52 分钟内达到了 75% 的条件覆盖率，而后者需要 30 个小时的时间窗口才能达到类似的覆盖率。此外，我们的工具在 130 个小时的时间范围内，仅提供有限的 10 个模拟实例 / 许可证情况下即可达到 80% 的覆盖率。在此期间，共进行了 19.9 万个测试用例，其中 6 千个测试用例与处理器的黄金模型产生了差异。我们的分析发现了 10 多个独特的不匹配之处，包括 RocketCore 中的两个新 bug 和与 RISC-V ISA 模拟器的差异。

Abstract

Modern computing systems heavily rely on hardware as the root of trust. However, their increasing complexity has given rise to security-critical vulnerabilities that cross-layer at-tacks can exploit. Traditional

hardware vulnerabilities hardware fuzzing ml-based hardware fuzzer coverage

发现论文，激发创造

FuzzerGym: 一种用于模糊测试和学习的竞争性框架

本研究旨在提出一种新型的 fuzzing 方法，它从程序当前状态信息入手，利用强化学习优化变异算子，以达到更全面的覆盖率，并使程序监视器与深度神经网络相连接，能够同时利用强化学习以及 fuzzing 的优势来优化测试用例。

Jul, 2018

利用生成人工智能增强灰盒模糊测试

本文介绍了一种名为 ChatFuzz 的灰盒模糊测试工具，它利用生成式人工智能生成特定格式的输入，以提高输入测试质量和覆盖范围，实验结果表明在特定情况下，该工具能比当前最先进的 AFL++ 模糊测试工具更好地检测程序漏洞。

Jun, 2023

深度强化模糊测试

本文提出一种新的基于强化学习的模糊测试方法，使用马尔可夫决策过程和深度 Q 学习算法实现。初步实证结果表明，与基准随机模糊测试方法相比，强化模糊测试能够取得更好的结果。

Jan, 2018

FairFuzz: 针对罕见条件进行测试以快速提高灰盒模糊测试覆盖率

本研究提出了一种名为 FairFuzz 的模糊测试工具，通过优化输入的变异方式和优先选择罕见程序部分的输入数据，提高了对程序的覆盖率，并在实际测试中表现出比现有工具更好的标准。

Sep, 2017

CovRL: 采用覆盖率引导的强化学习为基础的模糊测试 JavaScript 引擎

本文提出了一种称为 CovRL（基于覆盖引导强化学习）的新技术，通过将大型语言模型（LLMs）与来自覆盖反馈的强化学习相结合，将覆盖引导直接集成到语言模型中，以改进漏洞检测效果，并在 V8 JavaScript 引擎中发现了 48 个真实世界相关安全漏洞。

Feb, 2024

基于大型语言模型的通用模糊测试

该研究介绍了 Fuzz4All，第一个在多种不同输入语言和不同语言特性中的通用模糊测试器，利用大型语言模型作为输入生成和变异引擎，以产生多样化和真实性的输入，对多种系统进行评估，发现了 76 个广泛使用的系统中的漏洞。

Aug, 2023

神经字节筛选器用于模糊测试：并非所有字节都相等

通过使用神经网络学习输入文件中的模式，将以前的 fuzzing 探索的经验用于指导未来的探索，从而实现对程序漏洞发现的改进。

Nov, 2017

LLAMAFUZZ：大型语言模型加强的灰盒模糊测试

利用预训练的大型语言模型 (LLM) 增强结构化数据的灰盒模糊测试，通过利用 LLM 的先前训练知识和基于 Magma 等基准的实验，LLAMAFUZZ 比其他方法平均提高了 41 个漏洞的检测，实现了一致的性能提升。

Jun, 2024

基于自动化模糊测试与运行时分析的 NLP 跨层次 5G 漏洞检测

本研究提出了一种利用运行时分析和机器学习检测 5G 软件栈漏洞、异常行为和性能下降的创新方法，并在 srsRAN 上进行测试，准确性达到 93.4% 至 95.9%。该方法可应用于各个领域的 5G 应用与关键基础设施中，实时发现漏洞并进行优先级排序。

May, 2023

基于大型语言模型的模糊测试技术综述

本文调查总结了截至 2024 年的最新方法，统计分析了三个领域（即 LLMs、模糊测试和基于 LLMs 的模糊测试），并探讨了将基于 LLMs 的模糊测试技术广泛应用于未来的潜力。

Feb, 2024