Jan, 2025
大语言模型中的数据不当使用检测的统计假设检验框架
A Statistical Hypothesis Testing Framework for Data Misappropriation
Detection in Large Language Models
TL;DR本文针对大语言模型(LLM)训练中出现的数据不当使用问题,提出了一种通过在版权训练数据中嵌入水印的方法进行检测的框架。研究中构建了一个统计检验框架,优化拒绝阈值,并控制了第一类和第二类错误,从而验证了该方法在实际应用中的有效性,具有重要的隐私保护和法律合规价值。