Apr, 2023

NNSplitter:自动权重混淆的 DNN 模型主动防御解决方案

TL;DR本文提出了一种主动深度神经网络模型知识保护方案,NNSplitter,通过将模型划分为权重模糊的难以执行且低性能的模型部分和权重的索引和原始值只有授权用户才能访问的模型机密部分,其中模型机密部分得以在托管执行环境下保护。同时,本文基于强化学习提出了一个控制器来减少权重数量,最大程度地减少模型精度损失,并且实验结果表明只修改 313 个权重可将模糊的 VGG-11 模型在 Fashion-MNIST 上的精度降至 10%,同时还展示了 NNSplitter 对于潜在攻击源如规范剪辑和微调攻击是具有隐蔽性和韧性的。