Dec, 2020

多模机器翻译中高效的物体级视觉上下文建模: 掩蔽无关物体有助于建立联系

TL;DR本文提出了一种基于物体级别视觉上下文建模的多模态机器翻译框架,采用对象掩模技术在可视模态下掩盖与源文本不相关的对象以实现翻译的视觉基础,同时引入了视觉加权翻译损失提高目标语言的视觉一致性,实验表明该模型优于现有的多模态机器翻译模型。