Sep, 2023

COCO-Counterfactuals: 自动构建的图像 - 文本对反事实例子

TL;DR利用文本到图像扩散模型,介绍了一种自动生成对应对的反事实例子的可扩展框架,创造了基于 MS-COCO 数据集的多模态反事实数据集 COCO-Counterfactuals,并通过人工评估验证了其质量,进一步表明现有的多模态模型受到了反事实图文对的挑战,并展示了 COCO-Counterfactuals 在通过训练数据增强改善跨域通用性的多模态视觉语言模型方面的实用性。