ICLRMar, 2024

通过平坦性实现大型语言模型的隐私保护微调

TL;DR在我们的研究中,我们揭示了 Differential Privacy(DP)技术在处理 Large Language Models(LLMs)的隐私和泛化之间的权衡中,DP 训练模型的损失平面的平坦程度起到了关键作用。我们进一步提出了一个全面的框架来强制执行适当的权重平坦度,从而大幅提高模型的泛化能力并保持竞争性的隐私保护。