Nov, 2022

学习自然语言模型中的用户 - 实体差分隐私

TL;DR本文提出了一种新颖的用户 - 实体差分隐私(UeDP)的概念,以同时为文本数据中的敏感实体和学习自然语言模型的数据所有者提供正式的隐私保护。为了保护 UeDP,我们开发了一种新算法 UeDP-Alg,该算法对用户和敏感实体采样过程进行紧密的敏感性边界优化,通过优化隐私损失和模型效用之间的平衡,证明了我们的 UeDP-Alg 在多个自然语言模型任务中比基准方法在相同隐私预算下的模型效用要好,使用基准数据集。