对基础视觉模型的对抗性攻击

Aug, 2023

Adversarial Attacks on Foundational Vision Models

Nathan Inkawhich, Gwendolyn McDonald, Ryan Luley

TL;DR本研究通过攻击深度特征表示来操纵开放世界感知模型，以解决封闭集下游任务，并在白盒、黑盒和模型类型迁移的情况下展示攻击的有效性，旨在识别这些模型的关键敌对弱点，以提高未来设计的鲁棒性。

Abstract

Rapid progress is being made in developing large, pretrained, task-agnostic foundational vision models such as CLIP, ALIGN, DINOv2, etc. In fact, we are approaching the point where these models do not have to be finetuned downstream, and can simply be used in zero-shot or with a lightw

vision models finetuning adversarial vulnerabilities ood detector adversarially robust

发现论文，激发创造

坚如磐石：开源基础模型能否用于为下游任务创建对抗性例子？

基于开源的基础模型 CLIP 的先前训练，我们揭示了其对下游模型的共享对抗性漏洞，并提出了一种名为 Patch Representation Misalignment（PRM）的简单而有效的对抗性攻击策略，该方法可以同时欺骗 4 个常见视觉 - 语言任务中的超过 20 个下游模型，呼吁在这些场景中更加谨慎。

Mar, 2024

使用 DINO 训练的 Vision Transformers 中的对抗攻击和防御探索

本研究是关于自监督视觉转换网络 (DINO) 对抗攻击鲁棒性的分析，研究结果发现采用自监督方法学习的特征比监督学习更加鲁棒，并通过 fine-tuning 分类头部实现较好的抵御能力。

Jun, 2022

对比语言 - 图像预训练（CLIP）模型是强大的超出分布检测器

该文章从预训练功能提取器、视觉超出分布（OOD）检测、语言图像预训练模型、对抗性操纵的 OOD 图像和视觉异常检测等方面进行了全面实验研究，证明了使用最近邻特征相似度作为 OOD 检测得分的对比语言 - 图像预训练模型实现了最先进的无监督 OOD 性能，同时可以在无内部分布微调的情况下获得有监督的最先进 OOD 检测性能，并指出需要基于实验研究建立新的视觉异常检测基准。

Mar, 2023

基础模型作为替代模型：迈向更实用的对抗攻击

该论文通过选择基础模型作为代理模型，提出了在 no-box 设置下生成图像噪声以满足新兴趋势的对抗攻击的创新想法，并使用基于边界的损失策略对目标图像上的基础模型进行微调，以提高攻击的效率和 AI 系统的整体鲁棒性。

Jul, 2023

对抗攻击下的稳健对比语言 - 图像预训练

本文提出了 RoCLIP 方法，通过与一组随机示例进行比较来有效地断开损坏图像 - 字幕对之间的关联，从而实现对 CLIP 多模态模型的强化预训练和微调，有效降低目标数据污染和后门攻击的成功率，并提高模型性能。

Mar, 2023

强大的 CLIP：用于强大的大规模视觉 - 语言模型的无监督对抗微调的视觉嵌入

我们提出了一种无监督的对抗微调方案来获得强大的 CLIP 视觉编码器，从而在依赖于 CLIP 的所有视觉下游任务（VLM，零样本分类）中获得强大的鲁棒性。

Feb, 2024

多模基础模型的对抗鲁棒性

本文研究了使用图像中的不可察觉攻击来改变多模态基础模型的标题输出，揭示了恶意内容提供者如何利用此方式伤害诚实用户，并强调了部署的多模态基础模型应采取对抗性攻击的对策。

Aug, 2023

对抗性对齐：打破攻击强度和其对人类感知的相关性之间的权衡

通过研究和比较多种神经网络，本文发现随着图片识别准确度的提高，对抗性攻击虽然越来越容易使模型改变分类决策，但同时攻击的特征也越来越远离与人类视觉识别相关的特征，即使人工以同样方式造成的影响。而通过神经协调器网络的训练，可以使神经网络更加接近人类视觉识别应有模式，从而提高对抗性攻击下的鲁棒性。

Jun, 2023

窃取隐形：通过对抗样本和时间侧信道揭示预训练的卷积神经网络模型

基于对对抗性图像分类模式的观察，我们提出一种用于盗取模型的方法，结合时间侧信道和对抗性图像分类，以指纹识别多个著名的卷积神经网络和 Vision Transformer 架构，该方法可在减少查询次数的同时保持高准确率。

Feb, 2024

重访视觉基础模型时代的主动学习

基于基础模型的主动学习策略通过利用稳定的表示形式，平衡不确定性估计和样本多样性，在标签效率方面取得了令人印象深刻的成果。

Jan, 2024