BriefGPT.xyz
Ask
alpha
关键词
white-box adversarial attacks
搜索结果 - 3
ICCV
图像活动预测及其自然语言解释的黑盒攻击
解释性人工智能 (XAI) 方法旨在描述深度神经网络的决策过程。本文首次评估基于自我合理化的图像识别模型生成的自然语言解释在黑盒攻击下的鲁棒性,我们通过对预测结果和相应解释之间的关联进行空间上的无限制、变异性的干扰来误导模型生成不忠实的解释
→
PDF
9 months ago
基于突变的神经文本检测器对抗攻击
本论文提出了基于字符和词语的变异操作方法,用于生成对抗样本以攻击最先进的自然文本检测器,从而逐渐减少机器学习模型和分类器的预测准确性。
PDF
a year ago
通过多样性的专门深度神经网络集成实现对抗鲁棒性
本文研究了利用多样的专业 CNNs 集成对黑盒对抗实例检测的影响,并加强白盒对抗攻击的生成,证明了不同专业集成的多样性如何减轻黑盒和白盒对抗示例的风险,并通过 MNIST 和 CIFAR-10 等实验证明了使用该集成可以检测大部分已知的黑盒
→
PDF
4 years ago
Prev
Next