BriefGPT.xyz
Ask
alpha
关键词
multimodal tasks
搜索结果 - 43
COLING
iParaphrasing:通过图像提取基于视觉的复述句
本文提出了一种新的任务 iParaphrasing,通过提取基于视觉的复述词(VGPs)来改善语言和图像多模态任务的性能,使用各种现有方法和基于神经网络的图像注意力方法建模 VGPs 之间的相似性并报告了结果。
PDF
6 years ago
EMNLP
多模态神经机器翻译中图像有效性的实证研究
本文在多模态翻译任务(英文图片翻译德文)中比较了多种注意力机制,并评估了模型利用图像改进翻译的能力,虽然取得了 Multi30k 数据集上超越最先进水平的成绩,但我们也发现并报告了机器在翻译时表现出不同的不当行为。
PDF
7 years ago
ICLR
多模态紧凑双线性池化用于多模态神经机器翻译
本文探讨了在多模态翻译中使用复合双线性池化方法的效果,通过将两种注意力特征进行外积组合,相比于基本的组合方法,其对于图像字幕翻译的表现有所提升。
PDF
7 years ago
Prev
Next