ACLJun, 2021

ViTA: 通过对齐对象标签进行视觉语言翻译

TL;DR该论文提出了一种名为 Volta 的系统,通过提取图像中的对象标签来增强多模式机器翻译系统的文本输入,成功地在 WAT 2021 的多模式翻译任务中获得了 BLEU 分数 44.6 和 51.6。