ACLNov, 2018

多模翻译的隐变量模型

TL;DR本研究提出一种多模态神经机器翻译模型,通过潜在变量模型来建模视觉和文本特征之间的交互,预测图像特征和提高翻译性能,可以在训练阶段利用视觉和文本输入,而在测试阶段不需要图像输入,通过预测图像特征等优化,同时利用合成数据等附加训练方式进一步提高翻译性能。