水印是深度伪造检测器的漏洞吗？重新思考积极数字取证技术

IJCAIApr, 2024

水印是深度伪造检测器的漏洞吗？重新思考积极数字取证技术

Are Watermarks Bugs for Deepfake Detectors? Rethinking Proactive Forensics

Xiaoshuai Wu, Xin Liao, Bo Ou, Yuling Liu, Zheng Qin

TL;DR通过对水印技术进行改进，提出了一种名为 AdvMark 的方法，可用于增强图像的取证性和对抗性检测，以对抗 Deepfake 合成技术的威胁。

Abstract

ai-generated content has accelerated the topic of media synthesis, particularly deepfake, which can manipulate our portraits for positive

ai-generated content media synthesis deepfake forensics adversarial watermarking

发现论文，激发创造

抗深度伪造换脸的鲁棒身份感知水印

该研究提出了第一个强大的身份感知水印框架，可以主动地进行检测和源追踪来对抗 Deepfake 人脸交换，并在不同数据集和处理设置下展示了最先进的性能。

Nov, 2023

AI 图像检测器的稳健性：基本限制与实际攻击

通过分析 AI 图像检测方法，研究了水印技术以及基于分类器的深度伪造检测器的强大性，发现在扰动预算较低的情况下，扩散纯化攻击能够有效地去除水印，而对于图像有明显更改的高扰动水印方法，我们开发了一种模型替换对抗攻击来成功去除水印。同时发现水印技术容易受到欺骗攻击，对开发者的声誉造成损害，并通过实验表明分类器的鲁棒性和可靠性之间存在基本的权衡关系。

Sep, 2023

ProMark: 主动扩散数字水印用于因果归因

通过生成式 AI (GenAI) 来合成和操纵图像的高级提示，然而创作者在 GenAI 训练中无法获得他们内容使用的认可或回报。因此，我们提出了一种叫做 ProMark 的因果归因技术，将合成生成的图像归因于其训练数据的概念，如对象、主题、模板、艺术家或风格。我们展示了我们可以将多达 $2^{16}$ 个独特的水印嵌入到训练数据中，并且每个训练图像可以包含多个水印。ProMark 在保持图像质量的同时，表现优于基于相关性的归因方法。最后，我们提供了几个定性示例，证明水印的存在传达了训练数据和合成图像之间的因果关系。

Mar, 2024

Adv-watermark: 一种新颖的水印扰动方法用于对抗性样本

本篇研究提出了将图像水印技术和对抗样本算法结合在一起生成一种新的对抗扰动 ——Adv-watermark，并且使用一种新的优化算法 Basin Hopping Evolution (BHE) 生成黑盒攻击模式下的对抗性水印，该方法比其他攻击方法更为高效和鲁棒。

Aug, 2020

双重防御：面部交换的针对性、可追踪和隐形的鲁棒水印技术

通过结合可追踪性和对抗性的新型全面主动防御机制 Dual Defense，将单一强大的水印隐式嵌入目标人脸，有效应对恶意人脸交换而引起的安全威胁，保持水印信息的完整性，具备优异的对抗性和可追踪性，并超越当前的防伪方法。

Oct, 2023

SepMark：用于统一源追踪和 Deepfake 检测的深度可分离水印技术

SepMark 是一种主动防御措施，采用基于编码器 - 解码器的水印嵌入方法，其中包含两个可分离解码器，Tracer 提供高鲁棒性，Detector 则对恶意畸变具有可选择性敏感性，只有 Tracer 和 Detector 组成的 SepMark 可以可靠地追踪标记人脸的可信来源并检测其标记后是否被篡改。

May, 2023

ROMark: 使用对抗训练的强韧数字水印系统

本文提出利用对抗式机器学习中的稳健优化算法来提高基于卷积神经网络的数字水印框架的鲁棒性，在 COCO 数据集上的实验证明，稳健优化可以显著提高数字水印框架的鲁棒性。

Oct, 2019

AI 生成内容逃避基于水印的检测

对基于水印的 AI 生成内容检测方法的鲁棒性进行了系统研究，并提出了一种对抗性后处理方法，该方法可以让 AI 生成的图像逃避检测，并且保持良好的视觉质量，从而凸显了当前水印检测方法的不足之处。

May, 2023

一个具有可证明保证的鲁棒且灵活的即插即用水印框架用于 AI 生成的图像

本文介绍了一个名为 RAW 的稳健而灵活的即插即用水印检测框架，它将可学习的水印直接引入原始图像数据中，并使用与水印共同训练的分类器来检测水印的存在。此框架在各种生成架构上可兼容，并支持训练后即时进行水印注入，通过整合最先进的平滑技术，不仅在水印图像误分类的假阳性率方面提供可证明的保证，而且在存在针对水印去除的某些对抗性攻击时也表现出显著的性能增强。在由最先进的扩散模型生成的各种图像上的实验证明与现有方法相比，我们的方法在检测带有对抗性攻击的水印图像时，AUROC 从 0.48 增加到 0.82，同时保持图像质量，表现为接近的 FID 和 CLIP 得分。

Jan, 2024

可靠的模型数字水印技术：在保持逃避性能的同时防御盗窃

利用扩散模型为防止未授权模型分发而合成无限制对抗样本作为触发器集合，通过知识注入而非错误记忆来促进独特的水印行为，并通过优化受保护模型的知识传递属性，无需过于猛烈的决策边界扰动即可将水印行为传递给提取替代物，从而提高对于逃避对手和水印清除攻击的鲁棒性。

Apr, 2024