Dec, 2023

合成数据训练在多模态关系抽取中胜过真实数据

TL;DR使用 Mutual Information-aware Multimodal Iterated Relational dAta GEneration (MI2RAGE) 方法,通过 Chained Cross-modal Generation (CCG) 促进生成数据的多样性,并利用 teacher network 选择与 ground-truth 标签具有高互信息的有价值的训练样本,相比于直接在合成数据上训练,我们观察到合成文本的 F1 得分提高了 24.06%,合成图像的 F1 得分提高了 26.42%。值得注意的是,我们最好的模型在完全合成图像上训练时,相对于在真实多模态数据上训练的现有最先进模型,在 F1 得分上提升了 3.76%。