- 关系型深度神经网络验证与跨执行边界细化
通过利用深度神经网络中跨执行的依赖关系,我们开发了一种可扩展的关系验证器 RACoon,准确验证了在广泛数据集、网络和关系属性上相对于 SOTA 基准的各种关系属性。
- 跨输入认证培训:通用扰动
我们提出了一种新的方法 CITRUS,用于训练网络以对抗 UAP 攻击者,通过广泛的评估表明,我们的方法在标准准确性方面表现出色(高达 10.3%),并在实际应用中实现了最佳认证 UAP 准确性指标的性能。
- 视觉语言预训练模型的普适对抗扰动
我们的研究通过提出新的黑盒方法生成有效且可转移的通用对抗扰动,以揭示 VLP 模型对于图像模态特定模式的不可感知扰动是否普遍敏感,进一步研究了增强 UAPs 的有效性和可转移性的方法,达到了有效且可传递的通用对抗攻击。
- AAAI生成量子分类器的通用对抗扰动
QuGAP 是一个用于生成量子分类器的通用对抗扰动(UAPs)的新框架,它利用生成模型生成加性 UAPs,并理论上证明它们的存在。此外,QuGAP 使用基于保真度约束的新型损失函数,采用量子生成模型生成酉 UAPs,实验证明了量子分类器容易 - 改进糖尿病视网膜病变检测的通用对抗性框架
通过使用通用对抗扰动来评估医学深度神经网络对糖尿病视网膜病变(DR)的检测的脆弱性,并使用通用对抗扰动对已训练模型进行微调以抵御对抗样本,提升了平均 3.41 Cohen-kappa 值和最大 31.92 Cohen-kappa 值的性能。
- Magmaw: 基于机器学习的无线通信系统中的模态不可知对抗攻击
基于机器学习的无线系统面临多种对抗性攻击,本文提出了一种名为 Magmaw 的黑盒攻击方法,能够对传输过无线信道的任何多模态信号生成通用对抗扰动。试验结果证实 Magmaw 在存在防御机制的情况下仍能导致性能显著下降,甚至对加密通信和常规通 - 图像分类中最新通用对抗扰动的比较评估
本文综述了最近在图像分类任务中的 UAPs 的进展,并将其分类为噪声攻击和生成器攻击,并提供了每个类别中代表性方法的全面概述,同时还评估了不同的损失函数在一致的培训框架内的各种攻击设置的有效性,最后提供了扰动的一些可视化及未来的潜在研究方向 - 通用对抗方向
本文介绍了深度神经网络中的普适性对抗性干扰及其转移问题,并提出了仅固定方向而自由调整干扰强度的通用对抗方向及基于主成分分析的算法,以解决对抗性干扰的转移问题。
- 文本分类器通用对抗策略
我们引入了一种新的通用对抗策略,通过在多个文本上学习一个单一的搜索策略,可以成功地找到通用的对抗样本,该策略基于与文本领域相关的名称替换和语义保留文本修改,并使用强化学习来提取强基线方法。
- 低维对抗扰动的起源
本文研究了低维敌对干扰、通用性敌对干扰等与分类有关主题,并给出了关于低维敌对干扰欺骗率的严格分析及与最近的启发式方法的成功之间的解释。实验证明了理论上的结果。
- CVPR通过通用对抗扰动对深度神经网络进行全局指纹识别
本文提出了一种新颖且实用的机制,通过模型提取攻击来验证是否从受害者模型中盗取了嫌疑模型,并针对深度神经网络模型提出了 UAP 指纹识别方法,训练了一个通过对比学习的编码器,可以在仅检测 20 个指纹的情况下以置信度 > 99.99 检测出模 - IJCAI通用对抗攻击综述
本研究总结了最近在通用对抗攻击领域里取得的进展,讨论了攻击和防御方面的挑战以及通用对抗攻击存在的原因,旨在成为一项动态研究,不定期更新其内容,包括图像、音频、视频和文本等多个领域,欢迎该领域的作者联系我们,以纳入您的新发现。
- 关于成功和简单性的再探:可传递的有针对性攻击
通过发现简单易用的可转移攻击可以取得很高的目标转移性能,本文提出了新的针对传输设置的评估方法,并显示了使用 logit loss 方法生成目标通用对抗扰动的有效性。
- AAAI元胞自动机生成的对抗图灵模式
本文通过在元胞自动机中生成图灵图案提出了数据无关的几乎不可见的通用扰动的一种快速有效的方法,并发现这种扰动显着降低了深度学习模型的性能,这可能导致严重的安全问题。
- 使用生成模型的可传递通用对抗扰动
本文提出了一种针对深度网络易受对抗扰动攻击的问题的方法,使用预训练网络生成图像无关对抗扰动(UAPs),并通过在源模型的第一层仅关注对抗能量的损失,提高了 UAPs 的传递性,并在实验中展示了该方法的优越性。
- 面向说话人识别的通用对抗扰动生成网络
本文研究了针对采用深度学习的生物特征识别系统的攻击方法,并证明了普适性对抗扰动的存在。我们提出了一种生成网络,通过学习低维正态分布与普适性对抗扰动的映射关系,将其应用于扰动输入信号以欺骗训练有素的说话人识别模型,并在 TIMIT 和 Lib - 通用对抗性音频扰动
本文展示了普适对抗扰动的存在,基于一些新提出的方法,使用惩罚公式可以成功实现针对音频分类体系结构的有目标攻击和无目标攻击。
- ICML深度卷积网络对 Gabor 噪声的敏感度
本研究发现深度卷积神经网络对于一些特定的噪声图案,如 Gabor 噪声图案和程式化噪声图案,存在易受干扰性,仍需进一步研究其原因和影响。
- ICCV图像检索的通用扰动攻击
首次尝试以攻击图像检索系统为目标,利用新的方法生成反检索通用对抗扰动,通过降低相关的排名度量来打破图像特征之间的邻域关系。我们的方法通过多尺度随机调整大小的方案和排名蒸馏策略扩展攻击方法,并在四个广泛使用的图像检索数据集上进行了评估。在不同 - MM深度卷积网络黑盒攻击的过程噪声对抗样本
本文介绍了一种使用程序噪声函数生成通用对抗扰动 (Universal Adversarial Perturbations,UAPs) 的方法,发现常见 DCN 模型(如 Inception v3 和 YOLO v3)具有系统漏洞,同时提出使