Mar, 2019

dpUGC: 学习用户生成内容的差分隐私表示

TL;DR本文提出了一种简单而有效的广义方法来将差分隐私应用于文本表示(即字嵌入)。基于该方法,我们提出了一种个人化的差分隐私字嵌入模型的用户级方法。所提出的方法保护了单个用户的隐私,尤其是在 UGC 数据共享方面提供了更好的隐私与数据效用的平衡。实验结果表明,这种训练好的嵌入模型可用于经典的文本分析任务。此外,所提出的学习差分隐私嵌入模型的方法既独立于框架又独立于数据,这有助于部署和共享。