预训练模型引导的零样本对抗鲁棒性微调

Jan, 2024

预训练模型引导的零样本对抗鲁棒性微调

Pre-trained Model Guided Fine-Tuning for Zero-Shot Adversarial Robustness

Sibo Wang, Jie Zhang, Zheng Yuan, Shiguang Shan

TL;DR本研究提出了预训练模型引导的对抗微调（PMG-AFT）方法，通过精心设计辅助分支，利用原始预训练模型的监督来增强模型的零样本对抗鲁棒性。对15个零样本数据集进行的广泛实验证明，PMG-AFT在顶部1的抗干扰准确性方面显著优于最先进的方法，平均提高了4.99%。此外，我们的方法还能持续改善干净准确性，平均提高了8.72%。

Abstract

Large-scale pre-trained vision-language models like clip have demonstrated impressive performance across various tasks, and exhibit remarkable zero-shot generalization capability, while they are also vulnerable t

发现论文，激发创造

对抗鲁棒性：从自监督预训练到微调

本研究将对抗训练引入自监督学习中，提出了一种通用的具有强健性的预训练模型，可以在提高最终模型的强健性和节省计算成本方面，对后续的微调任务有两种作用。我们进行了大量实验，证明了所提出的框架与传统的对抗训练基线相比，在CIFAR-10数据集上可以获得大幅的性能提升。同时，我们发现不同的自监督预训练模型具有不同的对抗性漏洞，并提出了一种集成策略来提高其强健性。

Mar, 2020

零样本模型的鲁棒微调

本文介绍了一种名为WiSE-FT的简单而有效的方法，可以通过对预先训练模型的加权平均来提高微调模型的鲁棒性，从而在分布移位下实现大幅度的准确性提升，并在不增加额外计算成本的情况下实现。

Sep, 2021

通过鲁棒临界微调改善对抗训练的泛化性能

本研究提出了一种名为Robustness Critical Fine-Tuning (RiFT)的新方法，其核心思想是通过在非鲁棒性关键模块上进行微调，利用冗余容量来提高泛化能力而不损害对抗性鲁棒性。实验证明，该方法可以在不损害对抗鲁棒性的同时，显著改善泛化能力和超出分布鲁棒性约1.5%。

Aug, 2023

视觉语言模型的领域泛化鲁棒微调

在具有有限训练数据并在分布转变下无法有效推广的情况下，传统的迁移学习方法效果有限。然而，最近的基础模型在分布转变下表现出了令人印象深刻的零样本推理能力和鲁棒性。为了解决这些问题，在此提出了一种适用于流行的视觉-语言基础模型CLIP的小样本微调方法，并对具有现实分布转变的具有挑战性的基准数据集进行了评估。实验证明，在训练数据供应的各个级别上，与只有视觉的模型相比，少样本CLIP微调在内部分布准确性和外部分布准确性方面表现更好，这为在使用真实世界数据的小样本学习应用中采用基础模型提供了强有力的动机。

Nov, 2023

强大的CLIP：用于强大的大规模视觉-语言模型的无监督对抗微调的视觉嵌入

我们提出了一种无监督的对抗微调方案来获得强大的CLIP视觉编码器，从而在依赖于CLIP的所有视觉下游任务（VLM，零样本分类）中获得强大的鲁棒性。

Feb, 2024

一个提示词足以提升预训练视觉语言模型的对抗鲁棒性

通过学习稳健的文本提示来提高视觉语言模型的对抗攻击的鲁棒性，该方法被称为对抗提示调优（APT），通过简单地向提示中添加一个学习到的单词，可以显著提高准确性和鲁棒性（epsilon=4/255），平均分别提高13%和8.5%。

Mar, 2024

对敌对提示调整的鲁棒泛化问题的重新审视

通过多模态提示学习来提高图像和文本特征的对齐度，利用预训练的 CLIP 强大的泛化能力，引导模型在对抗性示例上增强鲁棒泛化能力，同时在干净示例上保持准确性。

May, 2024

提升视觉语言模型对抗鲁棒性的混合防御策略

本研究解决了视觉语言模型（VLM）在对抗攻击下鲁棒性不足的问题，提出了一种新颖的对抗训练框架，综合多种攻击策略和先进的机器学习技术。实验结果显示，该方法显著提升了VLM在真实数据集上的鲁棒性，CLIP模型在对抗扰动图像上的准确率从基准模型的4%提升至43.5%。

Oct, 2024

文本引导注意力是实现视觉语言模型零样本鲁棒性的全部需要

本研究针对预训练视觉语言模型（如CLIP）在面临对抗样本时的脆弱性问题，提出了一种名为“零样本鲁棒性的文本引导注意力”（TGA-ZSR）的新策略。通过对注意力的精炼和模型约束模块的设计，本方法显著提高了模型在对抗样本下的鲁棒性，并在16个数据集上相较于现有技术提升了9.58%的零样本鲁棒准确率。

Oct, 2024

文本引导的注意力即是提升视觉-语言模型零-shot 鲁棒性的关键

本研究解决了预训练视觉-语言模型（如 CLIP）在面对对抗样本时的脆弱性问题。我们提出了一种新颖的方法——文本引导注意力零-shot 鲁棒性框架（TGA-ZSR），通过引入注意力精炼模块和基于注意力的模型约束模块，显著提高了模型在16个数据集上的零-shot 鲁棒准确率，提升幅度达9.58%。

Oct, 2024