CVPRApr, 2021

通过知识蒸馏应对视觉问答差异预测任务中的缺失模态

TL;DR本文提出了一种新颖的方法来解决视觉问答 - 差异预测任务中由缺失模态引起的问题,使用特权知识蒸馏方案来处理测试时缺少的基本真相答案,通过一个采用图像 / 问题 / 答案三元组作为输入的 “大型” 教师模型以及一种将知识蒸馏到以图像 / 问题对作为输入的目标网络(学生)的模型组合,我们在 VizWiz 和 VQA-V2 答案差异数据集上进行了实验证明了我们的方法的性能和未来研究的多样性。