Jun, 2024

Bileve:使用双层签名保护大型语言模型中的文本来源免受欺诈

TL;DR通过引入一种双层签名方案(Bileve),本研究在大型语言模型中使用文本水印以提高源头追踪能力,并对抗欺骗攻击。实验证明 Bileve 在增强检测能力方面表现出色,有效地防止了欺骗攻击。