Nov, 2023

DP-Mix: 基于 Mixup 的差分隐私学习数据增强

TL;DR通过对数据进行增强,尤其是在训练数据有限的情况下,数据增强技术可以显著提高计算机视觉模型的泛化能力。然而,由于不同 ially private learning 方法固有的假设,即每个训练图像对学习模型的贡献是有限的,这些技术与不同 ially private 学习方法在基本上不兼容。本文研究了为什么多样本数据增强技术(如 mixup)的朴素应用无法取得良好的性能,并提出了两种新型的数据增强技术,专门针对不同 ially private 学习的约束条件。我们的第一种技术 DP-Mix_Self 通过在自我增强的数据上执行 mixup,在一系列数据集和设置中实现了具有 SoTA 分类性能。我们的第二种技术 DP-Mix_Diff 通过将来自预训练扩散模型的合成数据纳入 mixup 过程中,进一步提高了性能。我们在此 URL 中开源了代码。