LANCE: 通过生成语言引导的对抗性图像进行视觉模型的压力测试

May, 2023

LANCE: 通过生成语言引导的对抗性图像进行视觉模型的压力测试

LANCE: Stress-testing Visual Models by Generating Language-guided Counterfactual Images

Viraj Prabhu, Sriram Yenamandra, Prithvijit Chattopadhyay, Judy Hoffman

TL;DR提出一种用于自动化模型应力测试的算法 —— 生成基于语言引导的反事实测试图像（LANCE）。利用大型语言模型和基于文本的图像编辑的最新进展，我们可以增加 IID 测试集的多样性和挑战性，而不会改变模型权重。我们基于生成的数据对一系列不同的预先训练模型的性能进行了基准测试，并观察到了显著且一致的性能下降。我们进一步分析了不同类型编辑的模型敏感性，并展示了它在揭示 ImageNet 中以前未知的类别级别模型偏差方面的适用性。

Abstract

We propose an automated algorithm to stress-test a trained visual model by generating language-guided →

stress-test visual model language-guided counterfactual test images model biases

发现论文，激发创造

利用反事实图像强化预训练模型

该论文提出了一种新的框架，通过语言引导生成对抗图片来加强分类模型。通过使用对抗图片数据集来测试模型的弱点，并将对抗图片作为增加的数据集来微调和加固分类模型，研究揭示了使用小规模对抗图片进行微调可以有效增强模型的性能。

Jun, 2024

用反事实推理发现大规模视觉 - 语言模型中的偏见

通过对现有的大规模视觉 - 语言模型进行大规模研究，我们发现社会属性，如种族、性别和形象特征，可以显著影响生成的有害内容、能力相关词汇、有害刻板印象和被描述个体的评分，同时也探讨了大规模视觉 - 语言模型和对应的语言模型之间的社会偏见关系和减缓偏见的推理策略。

May, 2024

揭示大规模视觉语言模型中的偏见

通过对不同的大型视觉 - 语言模型（LVLMs）生成的文本进行大规模研究，我们发现输入图像中所描绘的社会属性（如种族、性别和外貌特征），能够显著地影响生成文本的毒性和与能力相关的词汇。

Mar, 2024

医学图像分类中的鲁棒性压力测试

通过深度神经网络对基于图像的疾病检测进行研究并进行临床验证，通过应力测试评估模型的稳健性和亚组性能差异，发现某些模型能够产生更稳健和公正的性能，并且预训练特征对下游稳健性起重要作用，强调应力测试在图像疾病检测模型的临床验证中应成为标准实践。

Aug, 2023

使用反事实例探究和减轻视觉 - 语言模型中的交叉社会偏见

使用文本到图像扩散模型在规模上生成对抗实例，以探测和缓解视觉 - 语言模型中的交叉社会偏见。

Nov, 2023

COCO-Counterfactuals: 自动构建的图像 - 文本对反事实例子

利用文本到图像扩散模型，介绍了一种自动生成对应对的反事实例子的可扩展框架，创造了基于 MS-COCO 数据集的多模态反事实数据集 COCO-Counterfactuals，并通过人工评估验证了其质量，进一步表明现有的多模态模型受到了反事实图文对的挑战，并展示了 COCO-Counterfactuals 在通过训练数据增强改善跨域通用性的多模态视觉语言模型方面的实用性。

Sep, 2023

检测意外偏差的图像反事实敏感性分析

本研究提出了一种名为图像反事实敏感性分析的框架，利用生成对抗网络建立一个面部图像的真实生成模型，以控制性地操作特定的图像特征，从而发现并检测面部分类器中的偏见和公平性。

Jun, 2019

基于语言引导对比学习的通用合成图像检测

本文提出了一种基于语言引导对比学习的合成图像检测方法，通过添加文本标签来进行联合文本 - 图像对比学习进行取证特征提取，并将合成图像检测问题制定为一种识别问题。该方法在准确性和 AUC 指标上明显优于同类问题的现有方法。

May, 2023

CounterCurate：通过反事实的例子增强物理和语义的视觉 - 语言组合推理能力

通过 CounterCurate 框架，综合改善对比式和生成式多模态模型的视觉 - 语言组合推理能力，通过解决忽视物理基础推理（计数和位置理解）和使用高能力文本和图像生成模型进行语义反事实微调的潜力等两个问题来提高推理性能。

Feb, 2024

他们都是医生：合成各种对抗偏见的反事实案例

通过生成合成的反事实图像集合，采用脱节模型训练方法来改善 Vision Language Models（VLMs）的公平性和性能。

Jun, 2024