机器学习数据适用性和性能测试的故障注入测试框架

Sep, 2023

机器学习数据适用性和性能测试的故障注入测试框架

Machine Learning Data Suitability and Performance Testing Using Fault Injection Testing Framework

Manal Rahal, Bestoun S. Ahmed, Jorgen Samuelsson

TL;DR创建弹性机器学习系统对于确保生产就绪的机器学习系统并顺利获取用户信任已成为必要。输入数据和模型的质量对数据敏感系统的端到端测试成功具有高度影响。然而，与模型测试相比，输入数据的测试方法缺乏系统性且较少。为了填补这一空白，本文提出了一种基于故障注入技术的输入数据故障注入测试框架（FIUL-Data），该框架测试机器学习模型对多种故意引发的数据故障的弹性。数据变异器探索机器学习系统的脆弱性，针对不同故障注入效果。提出的框架基于三个主要想法设计：变异器不是随机的；在某个时刻应用一个数据变异器；事先优化选定的机器学习模型。本文使用来自分析化学的数据进行了 FIUL-Data 框架的实证评估，包括反义寡核苷酸保留时间测量。经验评估分为两个步骤进行，首先分析选定机器学习模型对数据变异的响应，然后对比彼此。结果显示 FIUL-Data 框架允许评估机器学习模型的弹性。在大多数实验情况下，较大的训练数据集上，机器学习模型表现出更高的弹性，在较小的训练集中梯度提升方法优于支持向量回归。总体而言，均方误差指标在评估模型弹性方面具有较高的敏感性。

Abstract

Creating resilient machine learning (ML) systems has become necessary to ensure production-ready ML systems that acquire user confidence seamlessly. The quality of the input data and the model highly influence the successful end-to-end testing in data-sensitive systems. However, the testing approaches of input data are not as systematic and are few compared

resilient machine learning systems fault injection for undesirable learning in input data data mutators resilience of ml models mean squared error metric

发现论文，激发创造

深度变异：深度学习系统的变异测试

本研究提出了一种专为深度学习系统设计的突变测试框架，通过注入故障来度量测试数据的质量，并在 MNIST 和 CIFAR-10 数据集上验证了其有效性。

May, 2018

PyTorch 模型的大规模故障注入应用──PyTorchFI 的扩展以提高验证效率

使用 PyTorchALFI 框架，引入了故障注入方法用于测试神经网络模型，包括定义测试场景、软件架构和分析测试结果等内容。

Oct, 2023

人工智能系统故障分析与故障注入综述

人工智能和大型语言模型的快速发展使其融入各个领域，尤其是在人工智能生成的内容方面显著提高了能力。本研究通过系统分析 160 篇论文和资料库，对人工智能系统六个层面上现有的故障分析和故障注入方法进行了综述，探讨了目前 AI 系统存在的故障、当前故障注入工具能够模拟的故障类型，以及模拟故障与真实故障之间的差距。此外，本综述为故障诊断提供了一个框架，评估了故障注入技术的最新进展，同时也识别出了提升 AI 系统韧性的改进领域。

Jun, 2024

基于变异的深度神经网络故障定位

深度神经网络的错误定位工具 deepmufl 在广泛的 DNN 模型中具有较好的有效性，并且可以在一半的错误定位时间内定位到高达 53/109 的错误位置，相比于静态和动态 DNN 错误定位系统具有更优的性能。

Sep, 2023

自动漏洞检测的机器学习极限

本文研究了机器学习用于自动漏洞检测的泛化问题，并提出了一种可行的模型基准测试方法来帮助研究人员更好地评估漏洞检测机器学习的进展。研究表明，当前模型对于特定的训练数据扩增方式表现出了较好的鲁棒性。

Jun, 2023

DLFuzz: 深度学习系统差分模糊化测试

本文提出了 DLFuzz, 第一个可引导 DL 系统暴露错误行为的差分模糊测试框架，相比于 DeepXplore 具有更高的神经元覆盖率、更高效的寻找故障输入、更小的干扰等优势。

Aug, 2018

通过基于变异的置信度平滑增强大型语言模型的故障检测

现有的故障检测方法在大型语言模型上表现不佳，因此我们提出了一种名为 MuCS 的基于提示变异的预测置信度平滑方法，该方法能显著提升现有方法在测试覆盖率上的改进达到 97.64%。

Apr, 2024

补充模型学习的基于突变的模糊测试

本文提出了一种方法，并使用它来学习应用程序并获得反例，使用 Minimally Adequate Teacher 框架，该方法结合了一致性测试和基于变异的 Fuzzing 方法，并应用于 Rigorous Exampination of Reactive Systems (RERS) 挑战中有限状态机模型的学习中。结果表明，这种方法适合于学习 LTL 的问题，而对于可达问题，还需要其他的学习方法。

Nov, 2016

一种多模块鲁棒的瞬时稳定性评估方法对抗虚假标签注入网络攻击

在这篇研究论文中，提出了一种名为多模块鲁棒的瞬态稳定性评估方法（MMR）来解决训练数据中虚假标签注入的问题，并引入人在循环训练策略（MMR-HIL）以进一步提高准确性和收敛速度。实验证明，MMR 和 MMR-HIL 方法在瞬态稳定性评估性能上表现出强大的鲁棒性，并且能够有效纠正受污染的标签，展现了优秀的恢复能力。

Jun, 2024

基于参数攻击的镭射注入嵌入式神经网络的评估

本文介绍机器学习系统安全相关的认证行动，并探讨了模型参数攻击方面的挑战。同时，我们详细介绍了利用激光缺陷注入手段成功对 32 位 Cortex-M 微控制器进行 BFA 变异的安全测试，并阐述了如何使用模拟来选择最敏感的参数位集合以避免不切实际的暴力策略。

Apr, 2023