Jan, 2024

使用半敏感特征训练差分隐私广告预测模型

TL;DR在数字广告中遇到的问题的基础上,我们引入了使用半敏感特征训练差分隐私(DP)机器学习模型的任务。在这个设置中,攻击者已知一部分特征(因此无需保护),而其余特征以及标签对攻击者来说是未知的,需要受到 DP 保护。该任务在使用完全 DP(需要保护标签和所有特征)或使用标签 DP(认为所有特征已知,只需保护标签)两者之间插值。我们提出了一种新的算法来训练具有半敏感特征的 DP 模型。通过对真实广告数据集进行实证评估,我们证明了我们的算法在效用上超过了(i)在所有特征(已知和未知)上运行的 DP 随机梯度下降(DP-SGD)基线,以及(ii)仅在已知特征上运行的标签 DP 算法(而舍弃未知特征)的基线。