Aug, 2023

CLIPTrans:基于预训练模型的多模态机器翻译中的视觉知识迁移

TL;DR本研究提出了CLIPTrans框架,通过简单地调整预训练的多模态M-CLIP和多语言mBART模型,使它们的嵌入空间对齐,并通过轻量级映射网络对mBART进行条件化。实验证明该框架的优点,并将标准基准提升了平均2.67个BLEU值。