Jun, 2014

深度片段嵌入用于双向图像句子映射

TL;DR该研究提出了一种通过多模态的可视图像和自然语言数据的嵌入来实现图像和句子的双向检索的模型,通过对图像和句子的片段进行嵌入到一个共同的空间,实现了片段对齐,从而在图像句子检索任务中显著提高了性能,并提供了可解释的预测结果。