Feb, 2023
CK-Transformer:基于常识知识的Transformer模型用于指代表达理解
CK-Transformer: Commonsense Knowledge Enhanced Transformers for
Referring Expression Comprehension
TL;DR本研究提出了一种基于常识知识增强的Transformer框架(CK-Transformer)用于图像中多模态指称表述的理解,实验结果表明CK-Transformer在KB-Ref任务上实现了一项新的最优表现,相比现有技术提高了3.14%的准确性。