Mar, 2024

水印式 LLM 的统计理解的改进

TL;DR本文研究了大型语言模型(LLMs)的水印问题,并将其模型畸变和检测能力之间的权衡视为一个基于 Kirchenbauer 等人(2023a)的绿 - 红算法的约束优化问题。通过该优化问题的最优解,我们证明了其具有良好的解析特性,从而更好地理解并启发了水印过程的算法设计。在此优化公式的基础上,我们开发了一种在线对偶梯度上升水印算法,并证明了其在模型畸变和检测能力之间的渐近帕累托最优性。这样的结果保证了平均增加的绿色列表概率和因此明确的检测能力(与之前的结果相比)。此外,我们对水印问题中模型畸变度量的选择进行了系统讨论。我们证明了选择 KL 散度的合理性,并介绍了现有的 “无畸变” 和困惑度标准存在的问题。最后,我们通过对广泛数据集的对比算法进行了实证评估。