Nov, 2017

带有实例损失的双路径卷积图像-文本嵌入

TL;DR本文提出了一种新的系统,以区分性地嵌入图像和文本到共享的视觉-文本空间,通过实例损失和端到端学习的双路径卷积网络来解决图像和文本匹配问题,并在Flickr 30k和MSCOCO上达到了与最先进方法相当的准确度,同时在基于语言的人员检索中取得了很大的改进。