Feb, 2024

通过数据水印证明 LLM 预先训练数据中的成员资格

TL;DR利用数据水印将版权持有者的作品用于 LLM 预训练进行检测,可作为一个重要的问题。我们研究了使用数据水印进行便于黑箱模型访问的有原则的检测的方法。通过应用随机抽样的数据水印,我们将检测问题构建为假设检验,从而提供了关于虚警率的保证。我们分析了水印的三个方面 —— 水印长度、复制次数和干扰,对假设检验的能力产生了影响。同时研究了水印在模型和数据集缩放下的检测力变化:虽然增加数据集规模会降低水印的检测力,但如果模型大小也增加,水印仍然具有一定的强度。最后,我们将 SHA 哈希视为自然水印,并展示了我们能够鲁棒地检测来自 BLOOM-176B 的训练数据中的哈希,只要它们出现了至少 90 次。综上,我们的结果指向了数据水印在实际应用中具有广阔前景。