Jan, 2024

神经网络的概率鲁棒性水印技术

TL;DR我们介绍了一种新颖的基于触发集的水印技术,该方法对功能盗取攻击表现出强韧性,特别是涉及提取和精炼的攻击。我们的方法不需要额外的模型训练,并且可以应用于任何模型架构。通过计算可在源模型和代理模型集之间传输的触发集,我们展示了如果集合可传输的概率相当高,它可以有效用于盗取模型的所有权验证。我们在多个基准测试上评估了我们的方法,并展示了在所有考虑的实验设置中,我们的方法优于当前最先进的水印技术。