AAAIDec, 2019

多模机器翻译的视觉一致性正则化训练

TL;DR本研究提出了视觉协议规范化训练的方法,通过引入简单而有效的多头协同注意模型,同时训练源到目标和目标到源的翻译模型,鼓励它们在生成语义等效的视觉词汇时共享相同的视觉信息。结果表明,该方法在 Multi30k 数据集上的性能优于竞争基线,并且进一步分析证明,提出的规范化训练能够有效地提高注意力在图像上的一致性,从而更好地利用视觉信息。