BriefGPT.xyz
Ask
alpha
关键词
shared visual-language embedding
搜索结果 - 1
多模态机器翻译的视觉注意力基础神经模型
我们介绍了一种新颖的多模式机器翻译模型,利用平行的视觉和文本信息。该模型通过视觉注意力锚定机制链接视觉和文本语义,并实现共享的视觉 - 语言嵌入和翻译器的联合优化,取得了在 Multi30K 和 Ambiguous COCO 数据集上有竞争
→
PDF
6 years ago
Prev
Next