BriefGPT.xyz
Ask
alpha
关键词
multi30k
搜索结果 - 2
场景图作为枢轴:基于视觉场景虚构的推理时无图像非监督多模式机器翻译
本研究旨在探讨一种更现实的无监督多模态机器翻译(UMMT)设定 —— 推理时无图片的 UMMT,在该模型中,模型使用源文本图像对进行训练,并且仅使用源文本输入进行测试。为实现推理时的纯文本输入,本文设计了一种视觉场景幻觉机制,用于动态生成伪
→
PDF
a year ago
COLING
多模态注意力神经机器翻译
本文将多模态注意力机制应用于图像字幕生成领域,通过在自然语言描述和图像上同时聚焦,实现了一种基于图像字幕的另一种语言描述生成方法,并在 Multi30k 数据集上取得了更好的效果。
PDF
8 years ago
Prev
Next