Feb, 2023

CK-Transformer:基于常识知识的Transformer模型用于指代表达理解

TL;DR本研究提出了一种基于常识知识增强的Transformer框架(CK-Transformer)用于图像中多模态指称表述的理解,实验结果表明CK-Transformer在KB-Ref任务上实现了一项新的最优表现,相比现有技术提高了3.14%的准确性。