BriefGPT.xyz
Jan, 2015
结合语言和视觉的多模式跳字模型
Combining Language and Vision with a Multimodal Skip-gram Model
HTML
PDF
Angeliki Lazaridou, Nghia The Pham, Marco Baroni
TL;DR
本研究通过将视觉信息纳入 SKIP-GRAM 模型,创新性地提出了一种多模式的词向量表达方式,并取得了良好的语义基准表现。同时,该模型还能够将视觉信息传递到所有词中,用于改进零样本图像标注和检索,并探索了抽象词汇的有趣视觉属性,为意义的具体化实现奠定了基础。
Abstract
We extend the effective
skip-gram
model of Mikolov et al. (2013) by taking
visual information
into account. Like S KIP - GRAM , our
multimodal mo
→