Transformer 中梯度泄漏的攻击和防御的理论洞察

Nov, 2023

Transformer 中梯度泄漏的攻击和防御的理论洞察

A Theoretical Insight into Attack and Defense of Gradient Leakage in Transformer

Chenyang Li, Zhao Song, Weixin Wang, Chiwun Yang

TL;DR梯度泄漏攻击与防御策略的全面分析，为基于变压器模型的隐私保护技术的发展做出了积极贡献，旨在促进保护敏感数据和在变压器模型背景下维护隐私的进展。

Abstract

The deep leakage from gradient (DLG) attack has emerged as a prevalent and highly effective method for extracting sensitive training data by inspecting exchanged gradients. This approach poses a substantial threat to the privacy of individuals and organizations alike. This research pre

deep leakage from gradient gradient leakage method transformer-based models privacy-preserving techniques sensitive data

发现论文，激发创造

透过树木看到森林：部分变压器梯度的数据泄漏

分布式机器学习中的梯度反演攻击问题及其对隐私数据的泄露风险进行研究和验证，并发现在语言模型的各个中间层存在训练数据泄露的漏洞。实验证实，单个 Transformer 层甚至一个线性组件的 0.54% 参数的梯度也存在训练数据泄露的问题。此外，研究还表明，在训练过程中对梯度应用差分隐私仅能提供有限的数据泄露保护。

Jun, 2024

梯度深度泄露

该论文通过实验证明了在现代多节点机器学习系统中，梯度交换流程中存在着可以泄露隐私数据的问题。作者指出梯度裁剪是当前最有效的解决方案。

Jun, 2019

基于 Transformer 的语言模型的梯度攻击

该研究首次针对 Transformer 的语言模型提出了梯度攻击问题，并提出了一个梯度攻击算法（TAG），该算法在 reconstructing training data 方面的效率得到了较大提高，表现出在 CoLA 数据集上攻击梯度，可以获得高达 90% 的数据，并且在大型模型、小型字典大小和小输入长度上具有更强的对手优势，旨在为 Transformer 的 NLP 模型中的隐私泄漏问题提供解决方案。

Mar, 2021

通过生成的渐变泄露审计联邦学习中的隐私防御

本文探讨了如何避免在联邦学习框架下，通过梯度信息泄露用户隐私的问题，并提出了一种名为生成梯度泄露的新型隐私泄露方法。作者为了解决这个问题，探讨了各种无梯度优化方法，并相对于梯度优化方法实现了更好的高质量图像重建效果。

Mar, 2022

iDLG: 梯度泄漏的改进深度学习

本文提出了一种名为 iDLG 的改良方法，该方法能够从共享梯度中提取与 DLG 方法不同的正确标签，并且该方法适用于使用交叉熵损失训练的任何可微分模型，具有优越性能。

Jan, 2020

防范梯度泄漏攻击的分布式 SGD 安全技术

本文提出了一种梯度泄露弹性分布式随机梯度下降方法，并通过差分隐私噪声控制来保证隐私安全，实验分析表明，该方法在保障差分隐私安全、模型性能和抗梯度泄露攻击性能方面优于现有方法。

May, 2023

神经网络图像分类中的梯度泄露训练数据理解

本文分析了基于梯度下降的攻击如何泄露深度学习模型的训练数据，并提出了一种度量安全性的指标，同时也提出了一种用于解决重构训练数据的优化问题的方法。

Nov, 2021

扩散模型的安全性研究：基于梯度引导的扩散模型导致严重数据泄漏

通过扩散模型并利用梯度指导的微调方法，我们提出了一种新的重建攻击方法，可通过泄露的梯度从图像处理系统中窃取私密的高分辨率图像。实验结果表明，我们的攻击方法能够成功恢复和窃取分辨率高达 512 x 512 像素的图像。此外，我们的攻击方法在图像重建的像素级准确性和时间效率方面明显优于其他攻击基准方法，并在一定程度上使差分隐私失效。

Jun, 2024

使用密钥锁模块的联邦学习梯度泄漏防御

本研究提供了关于梯度泄露问题的详细分析和新的防御技术，设计和训练了一个私有的键锁模块用于保护模型架构，确保梯度信息的安全性和模型性能均得到维护。

May, 2023

关于利用差分隐私和经典正则化技术进行优化的效用与保护

该文探讨了在深度学习模型中如何保护训练数据的隐私，比较了不同优化方法对模型性能、训练效果和隐私攻击的影响，并确定了 dropout 和 l2 正则化作为较优秀的隐私保护方法。

Sep, 2022