EMNLPMar, 2021

基于 Transformer 的语言模型的梯度攻击

TL;DR该研究首次针对 Transformer 的语言模型提出了梯度攻击问题,并提出了一个梯度攻击算法(TAG),该算法在 reconstructing training data 方面的效率得到了较大提高,表现出在 CoLA 数据集上攻击梯度,可以获得高达 90% 的数据,并且在大型模型、小型字典大小和小输入长度上具有更强的对手优势,旨在为 Transformer 的 NLP 模型中的隐私泄漏问题提供解决方案。