MIRA：基于模型反演的去除攻击方法破解深度神经网络中的黑盒水印技术

Sep, 2023

MIRA：基于模型反演的去除攻击方法破解深度神经网络中的黑盒水印技术

MIRA: Cracking Black-box Watermarking on Deep Neural Networks via Model Inversion-based Removal Attacks

Yifan Lu, Wenxuan Li, Mi Zhang, Xudong Pan, Min Yang

TL;DR我们提出了一种新的基于模型反演的移除攻击（Mira），该攻击不针对特定的水印，并且对大多数主流的黑盒深度神经网络水印方案都有效。我们的攻击方法利用受保护模型的内部信息来恢复并取消学习水印信息，并且还设计了目标类别检测和恢复样本分割算法来减小 Mira 攻击带来的效用损失，实现对一半水印方案的无数据水印去除。我们在三个基准数据集和深度神经网络架构上对 Mira 进行了全面评估，与六种基线攻击相比，Mira 对覆盖的水印具有强大的去除效果，在更宽松甚至无对数据集可用性的假设下，保留了至少 90% 的被窃模型效用。

Abstract

To protect the intellectual property of well-trained deep neural networks (DNNs), black-box dnn watermarks, which are embedded into the prediction behavior of DNN models on a set of specially-crafted samples, hav

deep neural networks black-box dnn watermarks removal attack model inversion watermark removal

发现论文，激发创造

关于基于后门的深度神经网络数字水印的鲁棒性

本论文研究了深度神经网络的数字水印技术并提出了黑盒和白盒的攻击方法，证明了该水印方案的不安全性，并指出需要一些其他技术来保护免受攻击。

Jun, 2019

图像分类深度神经网络的数字水印技术的强度评估（扩展版）

本文通过对 DNN 水印方案进行评估，发现目前的水印方案在实践中都不够稳健，需要通过更加全面的攻击评估来提高稳健性。

Aug, 2021

微调不够用：一种简单而有效的用于 DNN 模型去水印的攻击方法

本文提出了一种新颖的水印去除攻击方法，能够有效和盲目地破坏水印模型对水印样本的记忆，实现了水印去除，并且提出了一种轻量级的微调策略，以提升模型性能和现有水印的鲁棒性。

Sep, 2020

神经网络清洗：从深度神经网络中移除黑匣子后门水印

本文提出了一种神经网络 “洗涤” 算法，可以即使在对水印结构没有先前知识的情况下，从神经网络中移除黑盒后门水印，有效消除了现有防御和版权保护机制使用的水印，并证明现有的后门水印不足以达到其声称的要求。

Apr, 2020

深度神经网络的隐秘稳健白盒水印技术 RIGA

本研究提出了一种使用对抗训练的新型白盒数字水印算法 ——RIGA，通过实验表明，该算法在不影响准确性的情况下，显著提高了水印的隐蔽性和鲁棒性，可应用于深度神经网络的水印技术中。

Oct, 2019

深度神经网络抗盗版水印

本研究介绍了一种旨在提高深度神经网络（DNN）中数字水印鲸吞强度的方法，该方法称为空嵌入（null embedding），通过对模型进行初始训练，我们建立了模型分类精确度与水印之间的强关系，使攻击者无法通过调整或增量训练来移除嵌入式数字水印，并且可以避免第三方嵌入 “盗版数字水印” 以索取模型所有权的情况。

Oct, 2019

提升模型鲁棒性：减少参数弱点的水印

深度神经网络的水印技术存在被移除的漏洞，本文通过研究参数空间，提出了一种寻找并恢复水印行为的强化模型水印技术，实验证明该方法提高了模型水印技术对参数变化和多种移除攻击的鲁棒性。

Sep, 2023

ROSE: 一种强健和安全的 DNN 水印技术

该研究提出了一种轻量级、强健、安全的黑盒 DNN 数字水印协议，在训练期间注入任务特定的键图像 - 标签对，并证明该模型的所有权，从而提供保护同时保持适当的安全性和强健性。

Jun, 2022

图像处理网络的模型水印技术

基于空间隐形水印技术，提出了一种图像处理模型的水印框架，防止模型权益被侵犯。实验证明，该水印技术可抵抗不同网络结构和目标函数训练出的替代模型。

Feb, 2020

将弱点转化为优势：通过后门方式对深度神经网络加入水印

该研究提出了一种黑匣子形式的深度神经网络水印方案，该方案适用于一般的分类任务，并可以轻松与当前的学习算法相结合。研究表明，这样的水印对于模型的主要任务没有明显的影响，并且评估了该提议的鲁棒性，以抵御广泛的实际攻击。

Feb, 2018