AAAIJul, 2022

通过多模态知识迁移的开放词汇多标签分类

TL;DR本研究提出一种新的基于开放词汇的跨模态知识迁移框架 (MKT),利用视觉和语言预训练模型的多模态知识,采用知识蒸馏技术和双流模块来实现多标签分类和多目标识别,并在公开基准数据集上显著优于现有方法。