Apr, 2019

多张图片,多个句子文档中的多模式链接的无监督发现

TL;DR通过探索图像和文本之间关联的算法,并基于文档中图像与文本集合是否同时出现的结构化训练目标,在不依赖于显式的多模态注释的情况下发现图像和句子之间的关系。