ACLJun, 2015

通过图片学习语言

TL;DR该研究提出了 Imaginet 模型,该模型可以从耦合文本和视觉输入中学习语言表达的视觉基础表示,采用多任务目标,并从视觉场景描述中获取单词的含义表达,并学习有效地利用语义解释多词短语的顺序结构。