Oct, 2023

通过对抗正则化进行的被动推理攻击对拆分学习的影响

TL;DR提出了 SDAR,这是一个针对 Split Learning 的新型攻击框架,利用辅助数据和对抗正则化来学习客户端私有模型的具有解码能力的模拟器,在标准 Split Learning 下有效地推断客户端的私有特征,在 U 形 Split Learning 下推断特征和标签。该攻击方法在实验验证中达到了与主动攻击相当的效果,尤其在现有被动攻击难以重构客户端私有数据的挑战性实际场景中,SDAR 在深度分割级别为 7 的 CIFAR-10 数据集上,在标准和 U 形 Split Learning 下实现了私有特征重构时的均方误差小于 0.025 的结果,并在 U 形设置中达到了超过 98% 的标签推断准确率,而现有攻击方法未能产生重要结果。