ICLRNov, 2015

图像和语言的序列嵌入

TL;DR本文倡导明确模拟视觉 - 语义层次中的偏序结构,介绍一个学习有序表示的通用方法,并展示了如何将其应用于涉及图像和语言的各种任务中,特别是超义预测和图像字幕检索,结果表明得到的表示优于当前方法。