Aug, 2024
遗忘以繁荣:利用机器遗忘技术解决预训练语言模型隐私泄露问题
Forget to Flourish: Leveraging Machine-Unlearning on Pretrained Language
Models for Privacy Leakage
TL;DR本研究解决了在私人数据上微调大型语言模型时可能带来的隐私风险。我们提出了一种新颖的攻击方法——模型遗忘技术,利用这一技术提升了隐私数据泄露的可能性,并在验证中显示出显著优于基线的效果。这项研究警示用户下载未经验证的预训练模型时可能面临的风险。