Sep, 2024

大型语言模型的预训练数据检测:基于发散的校准方法

TL;DR本研究解决了大型语言模型预训练数据透明度不足所带来的科学评估与伦理部署挑战。提出了一种基于发散的校准方法,通过计算令牌概率分布与令牌频率分布之间的交叉熵来提高检测性能。实验结果表明,该方法在英文基准和中文基准PatentMIA上显著优于现有检测方法。