May, 2024

大规模语言模型的文体水印

TL;DR提出了一种新的方法来生成文本水印,通过策略性地改变生成过程中的令牌概率,利用语言学特征(如风格学)对大型语言模型(LLMs)进行参数化,以提高鲁棒性和应对传统攻击。