Mar, 2024

WARDEN:多向背门数字水印用于嵌入式服务版权保护

TL;DREmbedding as a Service (EaaS) 是一个被广泛采用的解决方案,它提供了用于处理自然语言处理(NLP)中各种下游任务的特征提取功能。然而,之前的研究表明 EaaS 可能容易受到模型提取攻击的影响,为了缓解这一问题,可以通过向文本嵌入添加后门水印,并在发布后验证攻击模型。通过对最近的 EaaS 水印策略 EmbMarker 的分析,我们设计了一种新的 CSE(聚类、选择、淘汰)攻击,它可以去除后门水印并保持嵌入的高效性,表明之前的水印方法可以被攻破。针对这一新的威胁,我们提出了一个新的协议,通过整合多个可能的水印方向,使水印的去除更加困难。我们的防御方法 WARDEN 显著增加了水印的隐蔽性,并经实证表明对抗 CSE 攻击有效。