May, 2023

从聚合数据中学习:编辑包和随机包的比较

TL;DR本文探讨了使用聚合的数据标签训练机器学习模型的可行性,并针对策展袋和随机袋进行了两种自然聚合过程的研究。在策展袋设置下,通过使用聚合标签计算损失函数的梯度,证明我们可以实现不降低性能的基于梯度的训练。在随机袋设置下,基于 Rademacher 复杂度提供了一种广义风险边界,并展示了如何通过经验风险最小化进行正则化以实现最小风险界限,我们的实验结果表明,聚合学习可以有效地保护用户隐私并保持模型精度。