信任,但要验证:随机平滑技术综述
论文介绍了如何通过随机光滑化技术来提高分类器对抗扰动的鲁棒性,使用该方法得到的ImageNet分类器在扰动范围小于0.5的情况下,具有49%的认证准确率,并且该方法在获得更高的认证准确率方面比其他方法更具优势。
Feb, 2019
本文提出使用对抗训练来提高基于随机平滑的分类器的效果,并设计一种适应平滑分类器的攻击方法,通过大量实验,得出这种方法在ImageNet和CIFAR-10上的性能显著胜过所有现有的可证明的L2-强健分类器,证明了这种方法是可靠的,且半监督学习和预训练能够进一步提高其效果。
Jun, 2019
通过一种新的框架,使用非高斯噪声和更广泛类型的攻击来实现在深度学习中的认证鲁棒性,并且比之前的方法提供更好的认证结果和新的随机平滑方法的视角。
Feb, 2020
通过随机平滑来证明分类器决策对于对抗性噪声不变,同时对噪声稳健性的保证受到多种因素的影响,例如平滑度量之间的差异和拟合威胁模型的选择。此外,该研究证明随着p的增加,随机平滑受到了维度诅咒的影响。
Jun, 2020
本文考虑攻击者是否可以只利用制造机器学习模型所依赖的随机性来破坏模型的安全性, 发现攻击者能够利用 Randomised Smoothing,一种用于提高模型抵抗对抗性攻击和量化不确定性的方法,背后基于对高斯噪声采样,来进行欺骗性认证,而且攻击只需要更改极小的随机数。因此,作者提出更新NIST的随机数测试准则,以使其更适用于安全和关键性的机器学习应用。
Jun, 2023
对随机平滑技术进行了改进以提高鲁棒性,包括引入新的训练方法和后处理方法,结果显示这些方法可以提高随机平滑分类器的鲁棒性性能和训练效率,并对基于模型集成的方法进行了理论分析。
Oct, 2023
通过采用置信区间与较少样本的统计估计方法,我们提供了一种新的方法来解决随机平滑中的计算负担,从而在标准方法中获得相同的统计保证。同时我们提出了一个随机版本的Clopper-Pearson置信区间,证明了这种方法的效果明显更好。
Jun, 2024