Feb, 2022

基于 Mean Teacher 的图像描述生成学习 (CaMEL)

TL;DR本文介绍了一种基于 Transformer 的图像描述模型 ——CaMEL,其包含两个相互连接的语言模型,采用知识蒸馏的均值教师学习方法,采用不同视觉特征提取器进行评估,结果表明该模型在 COCO 数据集上取得了最先进的结果。