Jun, 2023

MuDPT: 针对大型预训练视觉语言模型的多模式深层联合调整

TL;DR本文介绍了一种基于多模态深度共生的 Prompt Tuning 方法,通过学习一个模型无关的变换网络,实现了深度的双向自然语言和视觉信息融合,在图像识别和领域外泛化方面表现优异。