- 您能相信您的解释吗?特征归因方法的健壮性测试
评估对非敌对扰动的稳健性并分析神经网络和表格数据集上应用的可解释 AI 方法的稳健性,展示如何利用流形假设和集成方法对稳健性进行深入分析。
- 学习算法与反事实解释生成算法之间的弱健壮兼容性
通过引入 PAC 学习理论的概念,为弱稳健性建立了 Oracle 不等式,给出了 PAC 弱稳健逼近性的充分条件。
- FashionFail:应对时尚物体检测与分割中的失败案例
基于时尚物品检测和分割的在线购物图像,在现有的时尚分割模型中存在局限性,尤其是在非模特穿戴的服装和特写镜头下。为了解决这些问题,我们引入了 FashionFail,这是一个用于目标检测和分割的时尚数据集。该数据集是使用我们的创新标注工具高效 - CVPR保留掩码属性编辑的分割模型基准测试
通过构建一个具有精确控制结构信息能力的保护掩模的属性编辑流程,我们研究了在不同类型场景下对分割模型的行为进行鲁棒性评估。我们发现局部和全局属性的变化对分割性能产生影响,并且模型对不同类型变化的敏感性不同。因此,我们认为局部属性与全局属性具有 - ProTIP: 针对随机扰动的文图扩散模型进行概率稳健性验证
通过引入概率性的文本到图像扩散模型(T2I DMs)的鲁棒性概念,并建立一个高效的统计性保证评估框架(ProTIP),本研究在解决生成过程的高计算成本和对比两个输出分布以确定扰动输入是否为对抗性示例的困难之后,通过实证实验验证了 ProTI - 对抗净化与微调方法用于鲁棒的 UDC 图像恢复
本研究探讨了增强屏下相机(UDC)图像恢复模型在对抗攻击下的鲁棒性,通过深度学习方法的评估和采用防御框架,包括扩散式对抗净化和进一步的微调,有效提高了图片恢复模型的弹性。
- 低剂量 CT 图像恢复的对抗鲁棒性评估
评估不同深度学习方法和经典方法在 CT 图像恢复中的鲁棒性,发现深度网络更容易受到未定向攻击的影响,数据一致性不受重建质量影响,需要更好的正则化方法。同时,深度网络和经典方法都容易受到对局部病变产生可见变化的攻击的影响,这些攻击可以用于探索 - 图形对比学习方法的对抗鲁棒性
通过对图结构的适应性敌对攻击评估节点和图分类任务,本研究介绍了一个全面的 GCL 模型鲁棒性评估协议,旨在探索 GCL 方法的鲁棒性,并为潜在的未来研究方向开辟新途径。
- SenTest: 句子编码器鲁棒性评估
通过对比学习方法评估句子编码器的鲁棒性,使用字符级、词级和句级攻击检验了模型的稳健性,结果显示模型在扰动数据集上的准确率可下降高达 15%,且当前的分类策略未能充分利用语义和句法结构信息。
- 防御来自公共模型的转移攻击
通过传输攻击和博弈论的视角,在新的威胁模型下提出了一种有效的防御方法,该方法在公共模型和多个数据集上进行了评估,并且在最强的传输攻击下相较于最好的对抗训练模型具有明显优势。
- 超越难样本:循环自增强的鲁棒有效的语法错误修正
本文研究了语法纠错方法在序列到序列范式中容易受到对抗攻击的问题,并提出了一种简单而非常有效的 Cycle Self-Augmenting (CSA) 方法来增强模型的鲁棒性,该方法通过在后期训练过程中利用语法纠错模型自身的数据以及引入循环训 - 视频质量评估模型的漏洞:对抗性攻击的挑战
通过黑盒攻击评估非参考视频质量评估模型的鲁棒性。
- 评估语义分割模型的对抗鲁棒性
该研究提出了一种基于梯度的迭代攻击方法来评估在语义图像分割领域中防御对抗扰动的模型的鲁棒性,并发现只有使用对抗样本进行训练才能获得鲁棒性,并分析了鲁棒性和准确性之间的权衡。
- 评估文本到图像扩散模型对真实攻击的鲁棒性
本研究对文本到图像扩散模型进行了鲁棒性评估,考虑到实际应用中可能存在的各种语义一致但现实错误的攻击方式,揭示了该模型的鲁棒性问题。
- 评估大规模视觉语言模型的对抗鲁棒性
本研究评估了开源大型视觉 - 语言模型的鲁棒性,发现黑盒查询可以进一步提高定向逃避的效果。研究结果为大型视觉 - 语言模型的敌对脆弱性提供了量化的理解,并呼吁在实际部署之前对它们的潜在安全漏洞进行更全面的研究。
- RNNS: 代码模型表示最近邻搜索黑盒攻击
本文提出了一种新型基于搜索的黑盒对抗攻击方法,即用于预训练编程语言模型的表示最近邻搜索来评估模型的鲁棒性,并在六个代码任务,三种编程语言和三个预训练代码模型上进行了评估,结果表明其优于目前最先进的黑盒攻击方法,并且能够有效地攻击防御模型。
- 通过对抗示例评估会话推荐系统的鲁棒性
本文介绍了一个对话推荐系统(CRSs)的鲁棒性评估方案,其中自动生成敌对样本以评估系统在不同输入数据面前的鲁棒性。通过执行这些敌对样本,我们可以比较不同 CRSs 满足用户偏好的能力,并表明测试的三个 CRSs 都不够稳健和可靠。
- ReCode: 代码生成模型的健壮性评估
本文提出一种针对代码生成模型综合鲁棒性评估的基准测试 ReCode,并定制了超过 30 种变形以评估模型的鲁棒性性能,同时提出了针对每种扰动类型的鲁棒性度量,重点观察了在 SOTA 模型上的表现,发现 CodeGen 比 InCoder 和 - ICML从局部几何的视角看 $β-$VAE 的对抗性鲁棒性
该论文研究了 Variational Autoencoder (VAE) 的脆弱性,提出了使用 pullback metric tensor 和 robustness evaluation scores 评估 VAE 的鲁棒性,并且实验证明 - IJCAICARBEN: 组合对抗鲁棒性基准测试
本文研究对抗攻击方法中的组合对抗攻击(CAA),对 CAA 的攻击顺序进行了研究,提供了不同模型的实时推理,并介绍了一个基准评测 CAA 的排行榜。