May, 2024

LMO-DP: 为巨型语言模型优化差分隐私微调的随机化机制

TL;DR通过提出一种新的基于语言模型的最优差分隐私(LMO-DP)机制,我们可以在强隐私环境下使用亚优差分隐私机制来准确微调大规模语言模型,并提出了一种离线最优噪声搜索方法来降低噪声幅度。通过大大优于高斯机制的性能,在 SST-2 数据集上,对具有 300M 参数的 RoBERTa-large 进行微调可以实现 92.20% 的准确率(给定 ε=0.3,δ=10^-10),类似的结果也在 GPT-2 的文本生成任务中发现。此外,基于我们的了解,LMO-DP 是第一个具有良好差分隐私保证的准确微调 Llama-2 的解决方案。