Oct, 2022

基于文本的知识助力视觉:视频行为预测的简单跨模态蒸馏

TL;DR本研究将预训练语言模型中的知识转移应用于视觉模型中,以提高动作预测的效果,实验表明简单的蒸馏技术可以在两个动作预测数据集上实现一定的相对增益。