MMJul, 2022

通过在线多标签识别增加视觉语言预训练文本多样性

TL;DR本论文提出了一种名为 IDEA 的方法,该方法利用多标签识别来增加文本多样性,从而提高视觉语言预训练(VLP)的性能,实验证明该方法可以在多个下游数据集上显著提升性能。