EMNLPNov, 2022

基于融合模型的多模态分类器对跨模态内容稀释的鲁棒性

TL;DR研究了多模态分类器对于跨模态稀释的抗干扰性,开发了一种在保持与图像和已有文本相关性和主题一致的前提下,能加剧多模态分类器失效的文本生成模型,并在危机人道主义和情感检测任务上进行了实验,结果表明该模型所生成的稀释文本能在更高程度上展示多模态分类器脆弱性,具有更高的相关性和主题一致性,有望进一步鼓励研究深度多模态模型对实际场景变化的抗干扰能力。