Oct, 2023

SemStamp: 文本生成的语义水印及其释义鲁棒性

TL;DR我们提出了一种基于局部敏感哈希(LSH)的鲁棒的句子级语义水印算法,通过将候选句子编码和LSH哈希一个由LLM生成的句子,并在语义嵌入空间中进行句子级拒绝采样,直到采样的句子落在带有水印的分区中,通过边缘约束来增强其鲁棒性,实验证明我们的算法不仅对常见和双字母语义重述攻击具有更强的鲁棒性,而且在生成质量上也更好。