Nov, 2015

学习深度结构保持的图像文本嵌入

TL;DR提出使用双分支神经网络进行联合嵌入图像和文本的方法,包含多层线性投影和非线性激活函数,通过结合度量学习和交叉视图约束优化进行训练,实验结果表明该方法在图像 - 文本检索和短语定位任务上具有显著性能改进。