Aug, 2024

MIA-Tuner:将大型语言模型适应为预训练文本检测器

TL;DR本研究解决了大型语言模型(LLMs)在隐私风险和版权问题审核上的缺口,提出了一种新颖的基于指令的成员推断攻击方法MIA-Tuner,通过指导LLMs自身作为更精确的预训练数据检测器,提升检测信心。此外,设计了两项基于指令的安全措施,以缓解隐私风险。实验结果表明,MIA-Tuner将MIA的AUC从0.7显著提高至0.9。