评估人工智能生成的医学图像中隐形水印的有效性
对基于水印的 AI 生成内容检测方法的鲁棒性进行了系统研究,并提出了一种对抗性后处理方法,该方法可以让 AI 生成的图像逃避检测,并且保持良好的视觉质量,从而凸显了当前水印检测方法的不足之处。
May, 2023
我们研究了数字水印技术对人脸识别模型有效性的影响,并提出了一种综合流程,通过人脸图像生成、数字水印和人脸识别的整合来系统地研究这个问题。我们的发现突显了数字水印技术与人脸识别准确性之间微妙的权衡关系,这对于负责任地利用生成模型进行人脸识别并引发关于水印技术在生物识别中的更广泛影响的讨论起到了重要的推动作用。
Apr, 2024
通过分析 AI 图像检测方法,研究了水印技术以及基于分类器的深度伪造检测器的强大性,发现在扰动预算较低的情况下,扩散纯化攻击能够有效地去除水印,而对于图像有明显更改的高扰动水印方法,我们开发了一种模型替换对抗攻击来成功去除水印。同时发现水印技术容易受到欺骗攻击,对开发者的声誉造成损害,并通过实验表明分类器的鲁棒性和可靠性之间存在基本的权衡关系。
Sep, 2023
通过对水印技术进行改进,提出了一种名为 AdvMark 的方法,可用于增强图像的取证性和对抗性检测,以对抗 Deepfake 合成技术的威胁。
Apr, 2024
该研究提出了第一个强大的身份感知水印框架,可以主动地进行检测和源追踪来对抗 Deepfake 人脸交换,并在不同数据集和处理设置下展示了最先进的性能。
Nov, 2023
最近,扩散模型(DMs)已成为图像合成的最先进方法,而基于 DMs 的编辑模型,以其高保真度和精度而闻名,无意中引入了与图像版权侵权和恶意编辑相关的新挑战。我们的工作是首次对这个问题进行规范化和解决。经过评估和试图增强传统图像水印技术后,我们意识到它们在这个新兴环境中的局限性。为此,我们开发了一种新颖的技术,RIW(稳健隐形水印),利用对抗示例技术嵌入隐形水印。与传统方法提供的 0% 相比,我们的技术确保了在编辑后的隐形水印的 96% 的高提取准确性。我们提供了我们的代码访问链接。
Nov, 2023
本文提出了首个应用于基于 mel 频谱图的音频扩散模型的水印技术,以解决音频机器学习领域中模型完整性和数据版权的问题。通过无形水印触发机制,该模型在良性音频生成中具有卓越性能,并能保护模型免受未经授权的修改。
Sep, 2023