Jan, 2017

将全局视觉特征合并到基于注意力的神经机器翻译中

TL;DR这篇论文介绍了多模态的注意力神经机器翻译模型,并将视觉特征整合在编码器和解码器的不同部分中,利用预训练的卷积神经网络提取全局图像特征,评估了不同策略整合全局图像特征的性能,并研究了添加合成多模态的多语言数据的影响,发现其对多模态模型有积极作用。实验结果表明,该模型在数据集上的性能明显优于同类短语级统计机器翻译模型,并是首次在该数据集上纯神经模型在全部评估指标上明显优于 PBSMT 模型。