EMNLPSep, 2021

基于视觉的概念组合

TL;DR我们提出了概念和关系图(CRG)和概念合成神经网络(Composer),通过对 CRG 的利用来进行视觉基础概念学习,从而学习原始和所有的复合概念,将它们与图像对齐,提高文本到图像匹配的准确性,并且在不同粒度级别(句级和词级)建模形成的基础概念,实现概念合成引领更加鲁棒的基础结果。