Jun, 2024

透过树木看到森林:部分变压器梯度的数据泄漏

TL;DR分布式机器学习中的梯度反演攻击问题及其对隐私数据的泄露风险进行研究和验证,并发现在语言模型的各个中间层存在训练数据泄露的漏洞。实验证实,单个 Transformer 层甚至一个线性组件的 0.54% 参数的梯度也存在训练数据泄露的问题。此外,研究还表明,在训练过程中对梯度应用差分隐私仅能提供有限的数据泄露保护。