BriefGPT.xyz
Ask
alpha
关键词
watermark removal attack
搜索结果 - 2
水印是否能幸存于翻译?关于大型语言模型中文本水印的跨语言一致性
我们引入了 “跨语言一致性” 概念,分析了当前文本水印技术在翻译成其他语言后的失效性,并提出了一种跨语言水印移除攻击(CWRA)方法,该方法可以在不降低性能的情况下从 0.95 降低 AUC 至 0.67,同时分析了两个影响跨语言一致性的关
→
PDF
5 months ago
IJCAI
微调不够用:一种简单而有效的用于 DNN 模型去水印的攻击方法
本文提出了一种新颖的水印去除攻击方法,能够有效和盲目地破坏水印模型对水印样本的记忆,实现了水印去除,并且提出了一种轻量级的微调策略,以提升模型性能和现有水印的鲁棒性。
PDF
4 years ago
Prev
Next