Oct, 2023

关于组间剪辑在差分隐私优化中的准确性和高效性

TL;DR在本研究中,我们深入研究了差分隐私优化中关键组成部分之一的逐样本梯度剪裁方式,发现不同的剪裁方式具有相同的时间复杂度,但存在准确性 - 内存消耗的权衡关系:粗粒度全部层剪裁通常提供最佳准确性,但相比于细粒度的分组剪裁,会带来更高的内存开销。我们通过收敛性理论和复杂性分析形式化表达了这种权衡关系。重要的是,我们证明了在更大的模型中,分组剪裁与全部层剪裁之间的准确性差距越来越小,而分组剪裁的内存优势仍然存在。因此,分组剪裁允许对大型模型进行差分隐私优化,以同时实现高准确性和低内存峰值。