ACLJun, 2023

跨模态属性插入,评估视觉语言学习的鲁棒性

TL;DR本文提出了一种跨模态属性插入的策略,该策略将图像中的视觉属性插入到文本数据中,用于深度视觉和语言模型的鲁棒性评估,并发现相对于纯文本数据,跨模态属性插入提高了深度视觉和语言模型的数据增广质量。