Jun, 2024

PostMark: 大型语言模型的稳健黑盒水印

TL;DR我们开发了 PostMark,这是一种模块化的事后水印程序,可以在解码过程完成后将一组依赖于输入的词语插入到文本中,而无需访问对数。与现有的水印方法相比,PostMark 对释词攻击更加鲁棒,并通过自动和人工评估来评估其对文本质量的影响,突出了质量和抗释词性之间的权衡。