Oct, 2022

面向持续视觉语言预训练的生成式负文本重播

TL;DR本研究针对连续多模态学习中的遗忘问题,通过伪文本回放和多模态知识蒸馏的方法,实现了基于图像和文本对的连续预训练,大幅提高了零样本图像分类和图像-文本检索任务的性能。