NNSplitter：自动权重混淆的 DNN 模型主动防御解决方案

Apr, 2023

NNSplitter：自动权重混淆的 DNN 模型主动防御解决方案

NNSplitter: An Active Defense Solution to DNN Model via Automated Weight Obfuscation

Tong Zhou, Yukui Luo, Shaolei Ren, Xiaolin Xu

TL;DR本文提出了一种主动深度神经网络模型知识保护方案，NNSplitter，通过将模型划分为权重模糊的难以执行且低性能的模型部分和权重的索引和原始值只有授权用户才能访问的模型机密部分，其中模型机密部分得以在托管执行环境下保护。同时，本文基于强化学习提出了一个控制器来减少权重数量，最大程度地减少模型精度损失，并且实验结果表明只修改 313 个权重可将模糊的 VGG-11 模型在 Fashion-MNIST 上的精度降至 10%，同时还展示了 NNSplitter 对于潜在攻击源如规范剪辑和微调攻击是具有隐蔽性和韧性的。

Abstract

As a type of valuable intellectual property (IP), deep neural network (DNN) models have been protected by techniques like watermarking. However, such passive model protection cannot fully prevent model abuse. In

deep neural network model protection ip protection model obfuscation trusted execution environment

发现论文，激发创造

拆分神经网络防御模型反演攻击的实用策略

本文介绍了在分裂网络联合学习模型下，攻击者可以通过模型倒置的攻击手段窃取用户隐私数据，并提出了一种基于简单的加性噪声方法以保护用户数据隐私，同时本文通过对比分析显示，采用现有的方法并不能完全防御攻击，需要采用多种组合的防御策略。

Apr, 2021

DeepObfuscation：通过知识蒸馏保护卷积神经网络结构

论文提出了深度学习模型模糊化的方法，通过模拟卷积神经网络的特征提取器使攻击者无法盗用模型设计，并采用递归模拟方法和联合训练方法训练模拟网络。最终得到的模糊化模型不会损失精度，能有效地保护深度学习模型的关键结构免遭攻击。

Jun, 2018

关于分割学习的数据无关模型反演、模型窃取和标签推理攻击

通过两种新攻击方法，我们表明 Split learning 算法不能保障训练数据和模型参数的安全，因此提供的隐私保护是虚假的。

Aug, 2021

防止属性推断、数据重建和特征空间劫持攻击的安全分裂学习

通过研究 SplitNN 及其所带来的潜在威胁和攻击，本研究提出了一种隐私保护的信息交换通道，利用可控的解决方案扰乱知识的传播，并使用新的激活函数 R3eLU 来有效地防御威胁。本研究的实验结果表明，该方法在绝大部分情况下都能较好地平衡防御和模型可用性。

Apr, 2023

IPGuard: 通过指纹分类边界保护深度神经网络的知识产权

本文提出了 IPGuard 方法，它通过数据指纹来保护深度神经网络分类器的知识产权，并且不会牺牲分类器的准确性，相比于现有的数字水印技术具有更好的保护效果。

Oct, 2019

SplitGuard：在分布式学习中检测和缓解训练劫持攻击

本文提出 SplitGuard 方法来检测分布式深度学习模型中的训练劫持攻击，以保障数据私密性的同时，最大化减少敏感信息恢复的风险。

Aug, 2021

盐加入推理：在移动计算中提升隐私并保持分裂推理的效率

通过分割推理和 Salted DNNs 方法，满足了边缘计算中保护输入和输出隐私的要求，并在保持了类似标准 DNN 的准确性和效率的同时，为未来研究提供了一个基准。

Oct, 2023

买卖环境中的模型版权保护

使用一种输入敏感的神经网络 (ISNN) 的版权保护方案，通过在训练阶段为干净图像添加特定扰动并将其标记为合法输入，用来保护深度神经网络 (DNN) 模型不受非信任环境中的泄露，实验证明该方案有效、合法且安全。

Dec, 2023

一个基于盲水印的框架来保护 DNN 知识产权：如何证明你的模型属于你

本研究提出了一种基于盲水印的知识产权保护（IPP）框架，通过将特定标签赋予普通样本并将其与独占标志组合生成水印来保护深度神经网络模型的知识产权，并成功验证了其安全性、可行性和鲁棒性，与创建者身份建立了明确的联系，有效应对了逃避攻击和恶意主张的问题。

Mar, 2019

MimosaNet：一种防止模型盗窃的模型

本文提出了一种方法，通过使深度神经网络对权重变化非常敏感，创建一个等效的神经网络模型，从而防止模型盗窃，这个等效模型具有与原来模型相同的响应和分类准确性。

Jul, 2019