Sep, 2024

对比解码技术在大型语言模型中检测预训练数据

TL;DR本文解决了大型语言模型训练数据的隐私和安全风险问题,提出了一种新颖的对比解码方法Con-ReCall。通过同时考虑成员和非成员上下文的分布差异,本文的研究表明,这种方法能够有效识别预训练数据,并在WikiMIA基准测试中展示了卓越的性能和对文本操纵技术的鲁棒性。