ICLRJan, 2024

从聚合响应中学习:实例级和包级损失函数

TL;DR由于隐私关切的增加,在许多实际应用中,培训数据在与学习者共享之前被聚合,以保护用户敏感响应的隐私。本文研究了两种用于从聚合响应中学习的自然损失函数:基于包的损失和基于实例的损失。我们展示了实例层面的损失可以被视为包层面损失的正则化形式。我们引入了一种结合这两种方法的新型插值估计器。对于线性回归任务,我们在训练集大小与特征维度成比例的渐近情况下,精确刻画了插值估计器的风险。我们的分析使我们能够从理论上理解不同因素对模型预测风险的影响。此外,我们提出了一种从聚合响应中实现差分隐私学习的机制,并在预测风险 - 隐私权衡方面推导出最佳包大小。我们还进行了彻底的实验证实了我们的理论,并展示了插值估计器的有效性。