Jun, 2022

免费提供隐私:数据集压缩如何帮助隐私?

TL;DR本文首次发现,原本用于提高训练效率的数据集压缩技术(dataset condensation, DC),在数据隐私保护方面也是替代传统数据生成器的更好解决方案。我们提出了在DC中提供隐私保护,并理论上证明DC合成的$m$个样本在参数分布上对网络的影响有限($O(m/n)$),同时通过试验证明DCsynthesized数据的可视隐私和成员隐私。本文的创新之处在于:通过数据压缩实现了数据高效性与隐私保护的双赢。