BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal word embeddings
搜索结果 - 1
基于视觉语境的多模态词表示学习
本研究提出了一种同时利用文本和视觉上下文以学习多模态词嵌入的端到端方法,通过将视觉上下文元素整合到多模态 skip-gram 模型中,探索了何种因素可以作为视觉上下文,并进行了实验和分析。
PDF
7 years ago
Prev
Next