ACLDec, 2021

KAT:一种知识增强的视觉与语言 Transformer 模型

TL;DR本文介绍了一种新型多模态转换方法 - 知识增强变压器(KAT),该方法在 OK-VQA 上取得了强有力的最新结果,同时还提高了模型预测的可解释性。