Sep, 2023

神经网络潜在表征中的对抗性机器学习

TL;DR通过信息论的背景将此问题转化为信息失真和鲁棒性的两个新度量,我们对分布式深度神经网络(DNNs)对抗行为的鲁棒性进行了严格分析,并通过考虑6种不同的DNN架构、6种不同的分布式DNN方法和对ImageNet-1K数据集进行10种不同的对抗攻击的广泛实验分析来验证我们的理论发现。实验结果支持我们的理论发现,显示出压缩的隐含表示可以在最佳情况下将对抗性攻击的成功率降低88%,平均降低57%,与对输入空间的攻击相比。