Jul, 2021

VidLanKD: 通过视频提炼的知识转移来改进语言理解

TL;DR本文提出了一种名为VidLanKD的视频-语言知识蒸馏方法,通过在视频文本数据集上训练一个多模教师模型,再将其知识转移到一个文本数据集上的学生语言模型,以达到优化语言理解的目的。实验结果表明,VidLanKD模型在多个语言理解任务上均取得了较好的效果。