Apr, 2017

学习用于图像文本匹配任务的双分支神经网络

TL;DR本文研究了两种神经网络结构用于学习图像和语言之间的相似性,其中一种网络结构学习了一个共享的潜在嵌入空间,另一种网络结构通过元素乘积将两个数据模态融合,并且实现了对于句子和图像的双向检索,取得了良好的结果。