ACLJan, 2021

KM-BART:用于视觉常识生成的知识增强多模态 BART 模型

TL;DR研究人员提出了一种称为 KM-BART 的知识增强的多模态序列到序列模型,可以从图像和文本的多模态输入中推理出常识知识,进而开发了新的预训练任务来提高模型在视觉常识生成任务中的性能,实验结果表明通过这些新的预训练任务,我们的模型在 VCG 任务上达到了最先进的性能水平。