ACLJan, 2021

跨语言视觉预训练用于多模式机器翻译

TL;DR本文结合视觉和语言的跨语言预训练方法,使用三重并行视觉和语言语料库进行预训练,并说明所学习的基于视觉的跨语言表示对于多模式机器翻译的性能具有领先优势。