ICLRSep, 2023

用于无数据模型窃取的双学生网络

TL;DR通过对称地训练两个学生模型,提供生成器一种生成样本的标准,使两个学生模型对样本有分歧,这个方法可以间接地估计目标模型的梯度,优化生成器网络的训练目标,并提供更准确的目标模型梯度估计和更好的基准分类数据集准确性。此外,在改进查询效率的同时,我们的方法仍具有训练计算成本的平衡,有效用于转移性对抗攻击的代理模型。