Sep, 2021

通过知识蒸馏开发多语言和混合编码的视觉问答系统

TL;DR提出一种基于知识蒸馏方法的英语语言-视觉模型拓展到同等效果的多语种和混合编码模型的方法,其使用多个中间层来逐步提取知识,同时在11种不同语言设置下创建大规模的多语种和混合编码的VQA数据集。