Sep, 2024

基于后门的模型水印技术的弱点:信息论视角

TL;DR本研究针对当前机器学习模型水印技术的脆弱性,特别是基于后门的水印嵌入方法,进行了深入探讨。通过信息论分析,揭示了水印抵御攻击的关键在于触发样本的选择,并提出了一种新颖的水印嵌入方案,以增强现有方法的抗攻击能力。实验结果显示,该方法在保持高效性的同时,对各种攻击具有良好的防御能力。