Nov, 2023

大规模嵌入模型的稀疏保持差分私有训练

TL;DR使用 DP-SGD 算法对大型嵌入模型进行隐私训练时,为了维持梯度稀疏性,我们提出了两个新算法 DP-FEST 和 DP-AdaFEST,能够在保持相当准确性的同时,实现梯度大小的大幅度降低($10^6 imes$)。