Oct, 2023

面向视觉 - 语言数据集的报告偏见:通过解耦对象 - 属性关联进行双模态增强

TL;DR通过双模态增强方法在视觉 - 语言数据集中解决报告偏倚问题,提升物体 - 属性理解并改善零样本检索任务效果。